马斯克:AI训练去年就已耗尽现实世界的所有资料

发布时间:2025-01-15 12:14:18 来源:互联网

1月13日消息,马斯克在CES期间接受采访时指出,现实世界能用来训练AI模型的资料,已经消耗的差不多了。

马斯克表示,基本上,AI训练已经将人类累计的知识全数耗尽,而这个时间点就是去年(2024年)。

马斯克的这一观点呼应了OpenAI前科学长Ilya Sutskever在去年12月机器学习会议“NeurIPS”上的说法,Sutskever当时表示,AI产业能够消耗的数据已经达到了顶峰。

面对现实世界数据的枯竭,马斯克暗示合成数据(synthetic data)将是未来的发展方向。

他指出,补充现实世界数据的唯一方法就是合成数据,由AI自行生成用于训练的数据,通过合成数据,AI将能够为自己打分,并展开自我学习的过程。

事实上,许多科技巨头已经开始使用合成数据来训练AI模型,微软、meta、OpenAI及Anthropic等企业已经在其AI模型训练中广泛应用合成数据。

科技市场研究机构Gartner估计,2024年AI及分析项目使用的数据中,约60%是合成数据。

例如,微软在1月8日开源的AI模型“Phi-4”就是通过合成数据结合现实世界数据进行训练的,谷歌的“Gemma”模型也采用了类似的方法。

Anthropic使用部分合成数据开发了表现最佳的系统之一“Claude 3.5 Sonnet”,而meta则运用AI生成数据来微调其最新推出的Llama系列模型。

本周热门攻略

1
91国产白浆洗澡背后隐藏的疑问:吊死重是什么?有何风险?

91国产白浆洗澡背后隐藏的疑问:吊死重是什么?有何风险?

2025/01/07

2
“高清乱码”与“男大爷”现象背后的深层次含义:为何它们在网络文化中如此火爆?

“高清乱码”与“男大爷”现象背后的深层次含义:为何它们在网络文化中如此火爆?

2025/01/11

3
《可不可以干湿你》:顾青州与觅芽子的深情纠葛,探索情感与生活的多重维度

《可不可以干湿你》:顾青州与觅芽子的深情纠葛,探索情感与生活的多重维度

2025/01/02

4
黄色软件app下载3.0.3免费版:如何确保安全下载并享受最佳体验?

黄色软件app下载3.0.3免费版:如何确保安全下载并享受最佳体验?

2025/01/09

5
天堂JMComicron.mic1.7.1版本详细介绍:功能、特点与应用场景解析

天堂JMComicron.mic1.7.1版本详细介绍:功能、特点与应用场景解析

2024/11/23

6
为什么宝宝睡前C1V1好满会影响宝宝的睡眠质量?如何改善宝宝睡眠?

为什么宝宝睡前C1V1好满会影响宝宝的睡眠质量?如何改善宝宝睡眠?

2024/12/07

7
欧美无人区码AAAAA的作用和发展趋势,如何提高物流行业效率并保证数据安全?

欧美无人区码AAAAA的作用和发展趋势,如何提高物流行业效率并保证数据安全?

2025/01/05

8
《天堂JMComicron.mic1.7.1》新版本有哪些值得期待的功能和改变?

《天堂JMComicron.mic1.7.1》新版本有哪些值得期待的功能和改变?

2024/12/08

9
如何在一级AE中制作毛毛片效果并重写为中文汉字长标题?

如何在一级AE中制作毛毛片效果并重写为中文汉字长标题?

2025/01/11

10
《别c我⋯啊⋯嗯上课呢》男男漫画解析:情感表达与社会反响引发广泛讨论

《别c我⋯啊⋯嗯上课呢》男男漫画解析:情感表达与社会反响引发广泛讨论

2024/12/13