Introduction
Pre-Training
Step 1: Download and preprocess the internet
Step 2: Tokenization
Step 3: Neural network training
Step 4: Inference
Base model
Post-Training: Supervised Finetuning
Conversations
Hallucinations
Knowledge of Self
Models need tokens to think
Things the model cannot do well
Post-Training: Reinforcement Learning
Reinforcement learning
DeepSeek-R1
AlphaGo
Reinforcement learning from human feedback (RLHF)
Preview of things to come
Keeping track of LLMs
Where to find LLMs
최신 대형 언어 모델(LLM) 정보를 효과적으로 추적하는 방법을 소개합니다
📌 El Marina에서는 최고의 LLM 모델을 순위로 제공하며, 인간이 직접 모델의 응답을 비교하여 평가.
🔹 랭킹 시스템:
익명의 인간 평가자가 모델의 답변을 비교 후 더 나은 모델을 선택 👀
이를 통해 객관적인 순위가 매겨짐
🔹 현재 상위 모델 (2025년 기준)
🥇 Google Gemini
🥈 OpenAI GPT
🥉 DeepSeek (MIT 오픈 라이선스 🎉)
👉 DeepSeek은 무료로 사용 가능한 강력한 오픈 웨이트 모델로 주목받고 있음!
⚠️ 최근 몇 달 사이 순위 조작 가능성이 제기됨. 실제 사용하며 성능을 직접 확인하는 것이 중요!
🔍 AI News
Swix & 팀이 운영하는 AI 관련 뉴스레터
거의 매일 새로운 정보 제공
일부는 LLM이 자동 생성, 일부는 사람이 직접 큐레이션
📌 AI 뉴스 팔로우하면 중요한 소식 놓칠 일 없음! 👍
🔥 AI 전문가들이 가장 활발하게 활동하는 곳은 X(트위터)!
AI 최신 뉴스 & 분석 실시간으로 확인 가능
신뢰할 수 있는 AI 연구자 및 전문가 팔로우 추천