
百川的大模型KnowHow
以下文章来源于 https://zhuanlan.zhihu.com/p/655984589
卷友们好,我是rumor。 大模型是一个实验工程,涉及数据清洗、底层框架、算法策略等多个工序,每个环节都有很多坑,因此 知道如何避坑非常重要,可以节省很多算力和时间,说白了就是一摞摞毛爷爷。近期百川智能发布了Baichuan2的7B和13B版本,可能有不少卷