(LTS) 资源与计划

动机、参考资料、涉及内容

梳理学习资源及计划

Pytorch 与分布式训练相关

Pytorch tutorial: https://pytorch.org/tutorials
博客园(罗西的思考), 包含了一些关于分布式机器学习的博客(最大的优点是注明了原文的出处), 博主还出了本书: https://www.cnblogs.com/rossiXYZ/
deepspeed
ColossalAI

大模型部署相关

量化

W8A8 指模型权重和激活值都量化到 8 bit int; W4A16 指模型权重量化到 4 bit int, 激活值保持为 FP 16

pytorch 原生量化

pytorch 中的量化公式

rapidapi

rapidapi: ToolLLM paper

pytorch compiler 相关

新闻

(2024/01/25) OpenAI 模型更新: https://openai.com/blog/new-embedding-models-and-api-updates: 文本嵌入模型 text-embedding-3-large 和 text-embedding-3-small, gpt 系列: gpt-3.5-turbo-0125 和 gpt-4-0125-preview, 合规检测模型(一个多分类模型, 免费使用): text-moderation-007
(2024/02/13) OpenAI ChatGPT 聊天界面增加记忆管理等新功能: https://openai.com/blog/memory-and-new-controls-for-chatgpt
(2024/02/09) Gemini Ultra: https://deepmind.google/technologies/gemini/#gemini-1.0
(2024/02/14) Gemini 1.5: https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/
(2024/02/16) OpenAI 文生视频: https://openai.com/sora

LLM 工具

博客

未归类

Langchain-Chatchat: https://github.com/chatchat-space/Langchain-Chatchat, 主要可以关注前端写法, 中文文本切分, 以及对 Langchain 的使用, asyncio 的用法等
一门深度学习系统课程: https://github.com/chenzomi12/DeepLearningSystem, B站/youtube 上还有视频课程