Série
Por dentro das LLMs
2 artigos
- 1 Do Common Crawl ao modelo base: como uma LLM aprende linguagem
Como uma LLM sai de dados brutos da web e chega ao modelo base: Transformer, Common Crawl, FineWeb, tokenização e pré-treinamento explicados sem enrolação.
- 2 De modelo base a ChatGPT: SFT, ferramentas e reinforcement learning
Como o modelo base de uma LLM vira o ChatGPT: supervised fine-tuning, uso de ferramentas, redução de alucinação e reinforcement learning explicados aqui.