“你们怎么看?”
黄仁勋的话音刚落,就有一个声音传出来:“我觉得纯扯!”
说话的是英伟达高级技术官,克里斯·马拉乔夫斯基,他接着这么说道:“将小参数AI模型作为决策核心替代原本自由的神经网络节点,在理论上就不可能行得通。”
“如果说原本的模型是一个线团,我们跑的很顺,像这么一搞,完全成了一团乱麻了!
“训练效率不仅得不到提升,还造成了极大的困恼,就我目前的测试而言,百万参数模型训练时的损失已经高达70%。
“而且,模型越大,损失也越大。到GPT4的水准,能损失到只剩千分之一不到。
“换句话说,如果要用这种方式训练GPT4,要消耗原本一千倍的算力资源!什么狗屁的死思考模型?将一万个小参数模型放一起,就类比人了?扯淡吧!”
克里斯听起来怨气颇深,自从卷耳智能科技的一百二十多项专利申请披露以来,克里斯这几天那是没有睡过一个好觉,别说类思维了,他感觉自己都快没有思维了。
不过,他得出的结论跟黄仁勋的想法是不谋而合的。
“可是耳语……”但一提到耳语,他们又都沉默了。
因为耳语事实存在,效果他们都看到了,那么就一定存在一个方案能够做到。是选择相信纪弘的一番乱扯,还是继续无头苍蝇一般的乱撞,都不是一个好的选择。
“还是要做!我们别无选择不是吗?”黄仁勋如此说道。
“我们只是硬件供应商,这些东西让搞AI的头疼去不行吗?”克里斯如此说道:
“你现在不是在中国吗?是否考虑去见一见卷耳智能科技的创始人,论GPU,全世界没有任何一家公司能比得上我们,这不是天然的合作者吗?”
克里斯是葡萄牙人,他不懂国人的思维,而黄仁勋是懂一些的,心里也是不断的摇头,如果有可能,他早就去了。
但卷耳智能科技第一个找上摩尔科技的时候他就知道,英伟达肯定是没戏的。倒不如指望OpenAI能够知耻而后勇,赶紧赶上来。
“不过还是去见见吧,就算不成,也没有什么损失不是吗?”黄仁勋寻思,来都来了,这里离河州也不算太远。
……
别说英伟达这种业内企业了,就算是八竿子打不着的网友们,这个夜晚也都选择不眠。
时间已是深夜,科技圈还热闹的很,简直就像过大年。
而“今年”的“春晚”只有一个主角,那就是类思维模型。
“一百多项专利我全都整理了,纪大在河州大学智算中心项目的启动仪式上讲的那番话,我也反复琢磨过。
“据此,我设计了一套实施方案【从0开始训练一套类思维大模型】,源程序上传到Gitee码云上了,地址是:s:‖gitee|class-thinking。有兴趣的可以下载下来一起试试,共同探讨。”
“我试了,根本不行啊,这效率,还不如直接从0搭建GPT呢!”
“你废话,专利文件肯定不可能给你披露细节的,这需要你一点点一点点的慢慢去试去调整,才能达到最佳。”
“能达到吗?我怎么觉得这就是个坑呢?我用数学模型做了一下评估,所有条件都考虑进去,看多少参数的小模型替代神经网络节点,结果是多少你们知道吗?答案是1。”
黄仁勋的话音刚落,就有一个声音传出来:“我觉得纯扯!”
说话的是英伟达高级技术官,克里斯·马拉乔夫斯基,他接着这么说道:“将小参数AI模型作为决策核心替代原本自由的神经网络节点,在理论上就不可能行得通。”
“如果说原本的模型是一个线团,我们跑的很顺,像这么一搞,完全成了一团乱麻了!
“训练效率不仅得不到提升,还造成了极大的困恼,就我目前的测试而言,百万参数模型训练时的损失已经高达70%。
“而且,模型越大,损失也越大。到GPT4的水准,能损失到只剩千分之一不到。
“换句话说,如果要用这种方式训练GPT4,要消耗原本一千倍的算力资源!什么狗屁的死思考模型?将一万个小参数模型放一起,就类比人了?扯淡吧!”
克里斯听起来怨气颇深,自从卷耳智能科技的一百二十多项专利申请披露以来,克里斯这几天那是没有睡过一个好觉,别说类思维了,他感觉自己都快没有思维了。
不过,他得出的结论跟黄仁勋的想法是不谋而合的。
“可是耳语……”但一提到耳语,他们又都沉默了。
因为耳语事实存在,效果他们都看到了,那么就一定存在一个方案能够做到。是选择相信纪弘的一番乱扯,还是继续无头苍蝇一般的乱撞,都不是一个好的选择。
“还是要做!我们别无选择不是吗?”黄仁勋如此说道。
“我们只是硬件供应商,这些东西让搞AI的头疼去不行吗?”克里斯如此说道:
“你现在不是在中国吗?是否考虑去见一见卷耳智能科技的创始人,论GPU,全世界没有任何一家公司能比得上我们,这不是天然的合作者吗?”
克里斯是葡萄牙人,他不懂国人的思维,而黄仁勋是懂一些的,心里也是不断的摇头,如果有可能,他早就去了。
但卷耳智能科技第一个找上摩尔科技的时候他就知道,英伟达肯定是没戏的。倒不如指望OpenAI能够知耻而后勇,赶紧赶上来。
“不过还是去见见吧,就算不成,也没有什么损失不是吗?”黄仁勋寻思,来都来了,这里离河州也不算太远。
……
别说英伟达这种业内企业了,就算是八竿子打不着的网友们,这个夜晚也都选择不眠。
时间已是深夜,科技圈还热闹的很,简直就像过大年。
而“今年”的“春晚”只有一个主角,那就是类思维模型。
“一百多项专利我全都整理了,纪大在河州大学智算中心项目的启动仪式上讲的那番话,我也反复琢磨过。
“据此,我设计了一套实施方案【从0开始训练一套类思维大模型】,源程序上传到Gitee码云上了,地址是:s:‖gitee|class-thinking。有兴趣的可以下载下来一起试试,共同探讨。”
“我试了,根本不行啊,这效率,还不如直接从0搭建GPT呢!”
“你废话,专利文件肯定不可能给你披露细节的,这需要你一点点一点点的慢慢去试去调整,才能达到最佳。”
“能达到吗?我怎么觉得这就是个坑呢?我用数学模型做了一下评估,所有条件都考虑进去,看多少参数的小模型替代神经网络节点,结果是多少你们知道吗?答案是1。”
为更好的阅读体验,本站章节内容基于百度转码进行转码展示,如有问题请您到源站阅读, 转码声明。
三七书屋邀请您进入最专业的小说搜索网站阅读年近三十,科技立业,年近三十,科技立业最新章节,年近三十,科技立业 三七书屋!
三七书屋邀请您进入最专业的小说搜索网站阅读年近三十,科技立业,年近三十,科技立业最新章节,年近三十,科技立业 三七书屋!