不小心看到網友說原始對岸訓練的 Atom7b 算是中立,找了半天沒有直接可以試的地方,但測試了 https://chinese.llama.family/ 上的 Llama2-Chinese-13b-chat ,的確沒有 CKIP那個 model 這麼歪。看起來微調的能力真的很重要。
最重要的是,他們把測試 LLM 能力的問題集做好了,這樣微調成果才會知道有沒有機會符合他們的價值。
---
https://github.com/AtomEcho/AtomBulb#%E5%A6%82%E4%BD%95%E8%AF%84%E4%BB%B7%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%83%BD%E5%8A%9B
何评价大模型的能力:
由于大模型在不同任务、知识上具有超强的通用能力,如何客观、准确地评价它们是一个巨大的挑战。为此,我们收集包含1000多条(持续更新)问题的测试集来测试大模型。这些测试问题覆盖了大模型不同维度的能力,能充分体现出大模型的通用能力。
折叠一下
虽然会说自己excited但是心里几乎毫无波澜,情绪只存在在嘴上为了让别的人类觉得我还是个人类这样。
有个同事经常在问他how are you的时候回答I’m tired ,今天听到另一个同事讲这个同事是不是应该去检查一下,都已经tired一年了。如果不是我在假装人类的话也会这么说的。
闲聊
我这个i人其实相当擅长small talk以及和陌生人侃大山 熟了后反而会诡异地束手束脚起来 这次去泰国玩要是没有朋友同行 我大概会抱着练口语的目的住青旅找外国旅游搭子 昨晚到机场已经10点多 打车回家和师傅聊了一路 碰到不说脏话不开黄腔的男司机也算难得 而且我受过坐司机快睡着的出租车的惊吓 也愿意陪他们聊聊提神
师傅说自己之前在北京呆了十几年做面点 呆腻了又回家自己开餐饮、搞工程车 疫情一来房地产一萎靡赔了个底掉 又到我这个城市找工作 找不着只能先跑滴滴 全职跑一年了 “我真没想过我会跑滴滴”“也没办法先过渡着” 又说孩子在老家上学、补课到处要花钱 “一节课 一个半小时 1500 这谁家能天天补啊 不补成绩又往下掉” 等等 我还没说啥师傅已经把家里几口人都交代干净了 可能也憋得慌 很多时候人就是更容易对陌生人敞开心扉 临了我到家 下车前本想说句“熬夜开车注意安全” 但i人本性发作 最终没说出口 只就着师傅之前的话头劝他这时候别乱投资 就走了
@Camus @ziwendong 感觉经此一役,以色列境内抗议司法改革的社会运动可能就要不了了之了。虽然以色列境内这个运动断断续续大半年,政府的镇压力度一直很大,但进了战时状态以后肯定更是难以为继,不管什么结果,以色列现在的极右翼都能趁机割一波,赢两次。。。