@fulkrum@qoto.org 怎么开源?模型不是都是黑盒(不了解其内部结构)的吗?
@Orca 黑盒指人们不懂机器学习的数学原理,就像物理中的唯象理论或是工科中的经验公式。训练模型本身所需的代码和技术方案还是传统的计算机程序。
@fulkrum@qoto.org 那这到底是在“开源”模型还是在开源模型的训练方法?
而且从知道怎么训练到有完成的模型也需要大量计算力(hence资本,微软甚至为了OpenAI专门设计了训练模型用的计算机集群),只是开源了模型的训练方法真的能说这是“开源了模型”吗?
@Orca 刚才PeterCxy讲了数据的重要性。训练模型硬件要求高我觉得不属于是否开源的讨论范畴,但讨论个人与资本的壁垒肯定要谈。
@Orca 哈哈,按需模型现在可是显学,比什么改内核教程多多了(电表加快警告)。这方面细节我也不懂,您搜fine tune和LoRA能看到很多文章。
@fulkrum@qoto.org Linux内核如果不从头开发,只是改一点东西的话,还是很容易的,Linux内核的模组化做得不错。
模型呢。。。