[유튜브 강의 정리] 안드레 카파시 - Deep Dive into LLMs like ChatGPT

Introduction

Pre-Training

Step 1: Download and preprocess the internet

Step 2: Tokenization

Step 3: Neural network training

Step 4: Inference

Base model

Post-Training: Supervised Finetuning

Conversations

Hallucinations

Knowledge of Self

Models need tokens to think

Things the model cannot do well

Post-Training: Reinforcement Learning

Reinforcement learning

DeepSeek-R1

AlphaGo

Reinforcement learning from human feedback (RLHF)

Preview of things to come

Keeping track of LLMs

Where to find LLMs

Keeping track of LLMs

🔍 LLM 동향 파악 방법 정리 🧠✨

최신 대형 언어 모델(LLM) 정보를 효과적으로 추적하는 방법을 소개합니다


1️⃣ El Marina: LLM 리더보드 🏆

📌 El Marina에서는 최고의 LLM 모델을 순위로 제공하며, 인간이 직접 모델의 응답을 비교하여 평가.

🔹 랭킹 시스템:

  • 익명의 인간 평가자가 모델의 답변을 비교 후 더 나은 모델을 선택 👀

  • 이를 통해 객관적인 순위가 매겨짐

🔹 현재 상위 모델 (2025년 기준)
🥇 Google Gemini
🥈 OpenAI GPT
🥉 DeepSeek (MIT 오픈 라이선스 🎉)
👉 DeepSeek은 무료로 사용 가능한 강력한 오픈 웨이트 모델로 주목받고 있음!

⚠️ 최근 몇 달 사이 순위 조작 가능성이 제기됨. 실제 사용하며 성능을 직접 확인하는 것이 중요!


2️⃣ AI 뉴스레터 "AI News" 📩

🔍 AI News

  • Swix & 팀이 운영하는 AI 관련 뉴스레터

  • 거의 매일 새로운 정보 제공

  • 일부는 LLM이 자동 생성, 일부는 사람이 직접 큐레이션

📌 AI 뉴스 팔로우하면 중요한 소식 놓칠 일 없음! 👍


3️⃣ 트위터(X) 활용 📢

🔥 AI 전문가들이 가장 활발하게 활동하는 곳은 X(트위터)!

  • AI 최신 뉴스 & 분석 실시간으로 확인 가능

  • 신뢰할 수 있는 AI 연구자 및 전문가 팔로우 추천