emmm……但实际上很多人会接受这样的逻辑,就是快乐就是载歌载舞,你说的没有证据只是阴谋论罢了
https://mp.weixin.qq.com/s/Or0OjFDVt_bwDE211-rTqQ
我在家里自己3D打印了一套XLeRobot,是一个开源轮式双臂机器人平台,带两个六自由度机械臂(夹爪),一个2自由度加深度摄像头的“头”,一个3电机驱动的轮式移动平台,一个Raspberry Pi。整套配下来不到1000美金(官网的660是不带Raspberry Pi和深度摄像头的)。可以用手柄、AR眼镜或者另外两个机械臂(leader arm)遥操作。
玩了之后,对张家兴老师跟我说的“具身智能现在最大的瓶颈不在硬件本体,而在算法”有了更深的认同。
首先,使用遥操作方法,这么一个便宜的轮式双臂机器人,连灵巧手都没有,就用夹爪,就已经能完成不少轻量级的家务了。因此,如果target是完成简单的家务,作为人的辅助而非替代,硬件本体不是挑战。
其次,目前就连拿杯子这类简单动作,都没有可以零样本泛化的VLA模型。所有在仿真环境里打榜天花乱坠的VLA模型,在真实世界中都没法零样本就用。如果针对XLeRobot场景做RL,出来的模型基本上只能用在一个任务(比如从桌上抓物体移动位置)上,换一个任务(比如擦桌子),就又得重新RL一遍。不信可以看看SimpleVLA-RL这些paper是怎么做的。这就像是ChatGPT出现之前,每个NLP任务都训练一个BERT模型一样,表面上看可以解决问题,但缺少泛化能力。
最后,算法以1Hz为界,可以分为长程规划和运动控制。1Hz以上的长程规划,现在LLM基本已经解决了,不管用Gemini Robotics-ER 1.5这种专用模型,还是用Gemini 2.5 Pro这种通用模型,把打扫房间分解成多个人类1秒可以完成的子步骤,已经成功率比较高了。而1Hz以下的运动控制,也就是一句话可以描述清楚,人类一秒内就能完成的简单动作,是VLA模型希望能做好,但目前还做不好的地方。这就是所谓的莫拉维克悖论。一部分人,以Pi的Sergey Levine为代表,认为模型架构不是瓶颈,只要加更多数据,就能搞定。另一部分人,以Yann Lecun为代表,认为必须要做世界模型,而V-JEPA 2这些世界模型的性能目前也不理想。
感谢XLeRobot社区和科大校友王高天师弟,给我们带来了可以低成本hands on体验机器人的开源生态。
faisys上很多人对AI的发展感到恐惧,担心自己的工作被AI取代。我的观点是,长期来看,AI,或者更广义的说,科技,会给我们带来更多自由。
几十年前,工作是国家分配,一个工作做一辈子;今天,每个人有一个固定工作,但换工作很正常了。这个固定工作的限制也在逐步放松,之前都是要上下班打卡,现在大多数头部科技公司不用打卡了,甚至允许远程工作。
今天像我们这样AI Native的公司,员工在世界各地remote,每个人按照自己的节奏作息,工作效率比每天去办公室通勤更高。很多人说我们十几个人的小团队竟然做了这么多事。
在AI的辅助下,很多人开始探索原子化工作,一个人如果有足够的产品sense,可以独立完成一个或多个产品;也可以为多个互相不竞争的公司工作,只要能够保证完成每份合同的任务就行了。因此,担心被AI取代这个事情,本质是因为AI是能力的放大器。只会一项很narrow的技能,又不是很精通,缺乏泛化能力的人,就容易被取代。避免被取代最重要的是提升全栈能力,多从第一性原理出发考虑问题,少在大厂内部政治里面内耗。
#老言论刷绿漆系列#这个观点和2019年出版的《专家之死》如出一撤,该书提出这是一个大众反叛的时代。当大众突然有了发言权,过去精英没办法听到的声音就表达出来了。过去也有反智,但大家看不到、听不到,就认为不存在。其实现实世界一直是这样,只是现在可见度更高。
![]()
没有任何一种命运是对人的惩罚,只要竭尽全力去穷尽它就应该是幸福的 加缪
人权律师谢阳近况:案件已经秘密开庭,长期被酷刑,被剥夺律师会见权、通信权,身体状况极差。在关押期间,父母双双去世。
https://bird.makeup/users/yesterdaybigcat/statuses/1950714655376334914
以前职场博主是告诉大家1不对,应该是2。现在则到处都是千奇百怪的3,能去1就是幸运无边了,至于2,根本就是老人的传说。
当整个结构不做人也不让人做人的时候,以“对方是人”为出发点的任何技术和策略都没有用。
我是见过以前“只要好好干活”的时代,和“不光干活要好”的时代,现在这种“和干活已经关系不大了”的时代,我曾经乐观地想“总得需要有人干活吧”,但可能我的乐观也是过时的。
#黑厂学
60块钱能让你学会三十二国语言 你还指望啥
相信世界上存在可以抵达永恒的美好