@fulkrum@qoto.org 怎么开源?模型不是都是黑盒(不了解其内部结构)的吗?
@Orca 黑盒指人们不懂机器学习的数学原理,就像物理中的唯象理论或是工科中的经验公式。训练模型本身所需的代码和技术方案还是传统的计算机程序。
@fulkrum@qoto.org 那这到底是在“开源”模型还是在开源模型的训练方法?
而且从知道怎么训练到有完成的模型也需要大量计算力(hence资本,微软甚至为了OpenAI专门设计了训练模型用的计算机集群),只是开源了模型的训练方法真的能说这是“开源了模型”吗?
@Orca 刚才PeterCxy讲了数据的重要性。训练模型硬件要求高我觉得不属于是否开源的讨论范畴,但讨论个人与资本的壁垒肯定要谈。
@fulkrum@qoto.org 是的,硬件条件和开源与否没有关系。但如果一份源代码没有普通人能运行起来,那其实这个开源还是开给资本的,不是给普通人的。
@Orca 我觉得这个定性太二元论了。开源后的模型个人完全能够自行修改,壁垒主要是个人难以从头训练。我认为这是当代大型软件的常态。以Linux桌面发行版为例,个人可以修改某组件,但很难独立从头开发整套系统。