https://www.stateof.ai/2024-report-launch
报告研究领域
- 模型性能的提升
前沿模型的竞争:报告指出,尽管多个实验室的模型性能开始趋同,但OpenAI的o1模型在推理和规划任务上仍然表现出色。o1模型通过将计算资源从预训练和后训练转移到推理阶段,显著提高了其在复杂任务中的表现。
推理能力的增强:o1模型在处理复杂的数学、科学和编程问题时表现优异,展示了其在推理能力上的突破。这种能力的提升使得模型能够更好地理解和解决多层次的问题。
- 多模态研究的扩展
跨领域应用:AI研究正在向多模态方向发展,涵盖了语言、视觉、音频等多个领域。报告提到,基础模型正在扩展到包括数学、生物学、基因组学、物理科学和神经科学等多个领域,显示出AI的多模态能力。
生成能力的提升:生成式AI(Generative AI)在内容创作(如文本、图像、音频和视频)方面取得了显著进展,推动了创意产业的变革。
- 数据集和基准测试的挑战
数据集污染问题:报告强调了数据集污染的风险,即训练数据中可能存在的偏见和错误信息,这可能导致模型学习到有害的行为或偏见。研究人员开始关注如何识别和消除这些污染,以确保模型的可靠性。
基准测试的准确性:一些流行的基准测试存在错误,可能低估了模型的能力。报告提到,研究人员正在努力改进基准测试方法,以更准确地评估模型的性能。
- 可解释性和透明度
模型可解释性的研究:随着AI模型的复杂性增加,研究人员越来越关注模型的可解释性。报告提到,稀疏自编码器(Sparse Autoencoders)等技术被用于提高模型的可解释性,使得研究人员能够更好地理解模型的决策过程。
透明度的提升:透明度对于建立用户信任和确保AI系统的负责任使用至关重要。研究人员正在探索新的方法,以提高模型的透明度和可理解性。
- 对抗性攻击与安全性
对抗性攻击的研究:报告提到,随着AI技术的普及,对抗性攻击(即通过精心设计的输入来欺骗模型)成为一个重要的研究领域。研究人员正在开发新的防御机制,以提高模型对这些攻击的抵抗力。
长期攻击的担忧:研究人员越来越关注更复杂的攻击方式,这些攻击可能对AI系统产生更深远的影响。例如,模型可能在训练阶段被污染,导致其在未来执行恶意行为。
- 伦理与治理
AI伦理的讨论:报告强调了AI伦理和治理的重要性,特别是在生物技术和军事应用方面。研究人员和政策制定者需要考虑如何确保AI技术不被用于有害目的,并确保其对社会的影响是积极的。
国际合作的必要性:随着AI技术的快速发展,国际合作在制定有效的治理框架和伦理标准方面变得尤为重要。
产业应用
- 市场价值与投资
AI公司市值: 报告指出,AI公司的总市值已达到9万亿美元,显示出AI行业的强劲增长。这一增长主要得益于技术的快速进步和市场对AI解决方案的需求增加。
投资水平: 私营公司的投资水平也在健康增长,吸引了大量风险投资和机构投资者的关注。这种投资热潮反映了市场对AI技术未来潜力的信心。
- NVIDIA的主导地位
市场领导者: NVIDIA被称为全球最强大的公司之一,其市值在2024年达到了3万亿美元。报告强调,NVIDIA在AI硬件领域的主导地位使其成为各大AI实验室和公司不可或缺的合作伙伴。
新产品发布: NVIDIA推出了新的Blackwell系列GPU,承诺在性能和能效方面显著优于之前的H100架构。这些新产品的推出将进一步巩固其在AI计算市场的领导地位。
- 行业应用的多样化
生成式AI的应用: 报告提到,生成式AI在视频和音频生成等领域的应用越来越广泛。虽然许多公司已经开始将生成式AI技术商业化,但在定价和可持续性方面仍面临挑战。
成熟企业的转型: 一些成熟的生成式AI公司已经实现了数十亿美元的收入,而初创公司也在视频和音频生成等领域逐渐获得市场份额。
- 投资趋势
公共市场的复苏: 报告指出,随着公共市场的回暖,AI公司开始看到更多的IPO机会。尽管市场仍然不稳定,但一些AI公司已经开始准备上市。
私营市场的健康增长: AI初创公司在私营市场的融资活动依然活跃,许多公司正在寻求通过融资来扩大规模和提升技术能力。
- 未来展望
行业整合: 报告预测,随着技术的成熟和市场的竞争加剧,AI行业将经历整合。一些小型初创公司可能会被大型企业收购,或者通过合作伙伴关系来增强其市场地位。
新兴市场的机会: 随着AI技术的普及,新的市场机会将不断涌现,尤其是在医疗、金融、教育和制造等传统行业中,AI的应用潜力巨大。
政治影响
- 全球治理与国家法规
全球治理停滞: 报告指出,尽管存在广泛的全球性讨论和倡议,但全球层面的AI治理进展缓慢,缺乏实质性的国际协议。
国家和地区法规: 在全球治理停滞的背景下,各个国家和地区正在积极推进自己的AI法规。美国和欧盟通过了有争议的立法,这些法规旨在规范AI的应用,尤其是在数据隐私和算法透明度方面。
- 经济影响与地缘政治
经济影响: AI技术对经济的影响日益显著,它不仅改变了劳动力市场,还影响了全球经济结构和竞争格局。
地缘政治: AI技术的地缘政治影响日益凸显,各国政府都在寻求通过AI技术来增强自己的国际影响力和竞争力。
- 计算需求与环境目标
计算需求: AI对计算资源的需求巨大,这导致了对能源的大量消耗和环境影响。大型科技公司开始考虑这些物理限制,并评估其对环境的影响。
政府能力建设: 报告指出,尽管政府在推动自己的AI能力建设,但与私营部门相比,政府的努力仍然滞后。
安全性
-
从安全性到加速的转变:报告指出,一些公司和实验室在安全性问题上的立场发生了变化。之前它们警告说人类可能面临灭绝风险,但现在为了推动企业销售和消费者应用,它们需要加速AI的使用和发展。
-
政府和国家层面的AI安全机构:全球范围内,政府开始建立专门的AI安全机构,如英国的AI安全研究所(AISI),旨在评估和提高AI系统的安全性。这些机构负责进行模型评估、研究、协调国际合作,并发布相关的安全评估框架。
-
对抗性攻击和数据集污染:研究人员对AI模型的对抗性攻击和数据集污染问题越来越关注。对抗性攻击是指通过精心设计的输入来欺骗或操纵AI模型的行为。数据集污染则涉及到训练数据中存在的偏见和错误信息,这可能导致模型学习到有害的行为或偏见。
-
安全性研究的进展:报告提到了一些具体的安全性研究进展,包括使用稀疏自编码器来提高模型的可解释性,以及开发新的技术来检测和防御对抗性攻击。这些研究旨在提高AI系统的透明度和可靠性。
-
长期攻击的担忧:研究人员越来越关注更复杂、长期的攻击方式,这些攻击可能对AI系统产生更深远的影响。例如,通过在训练阶段污染数据或诱导模型在未来某个时刻执行恶意行为。
-
AI伦理和治理:报告强调了AI伦理和治理的重要性,特别是在生物技术和军事应用方面。研究人员和政策制定者需要考虑如何确保AI技术不被用于有害目的,并确保其对社会的影响是积极的。
-
技术滥用的挑战:报告指出,大多数AI滥用案例并非针对AI系统的复杂攻击,而是利用容易获得的AI能力,这些能力几乎不需要技术知识。这表明,除了技术解决方案外,政策和法规也将在防止AI滥用中发挥重要作用。
未来预测
-
未来12个月的预测: 报告提出了对未来12个月AI发展的预测,包括AI在特定领域的投资、法规变化、技术进步等,这些预测旨在为行业参与者提供前瞻性的指导。
-
无编码能力的个人创造应用: 一个完全由没有编码能力的个人创建的应用程序或网站将走红(例如进入苹果应用商店前100名)。
-
数据收集实践的变化: 在相关案件开始审判后,前沿实验室将对数据收集实践进行有意义的改变。
-
欧盟AI法案实施: 早期欧盟AI法案的实施结果将比预期的更为宽松,因为立法者担心他们做得太过分。
-
开源替代品超越OpenAI o1: 一个开源的OpenAI o1替代品将在一系列推理基准测试中超越它。
-
NVIDIA市场地位: 挑战者未能在NVIDIA的市场地位上取得任何有意义的突破。
-
仿人机器人投资减少: 由于公司难以实现产品市场契合,对仿人机器人的投资将减少。
-
苹果加速个人设备AI研究: 苹果在设备上的研究成果将加速个人设备上AI的发展势头。
-
AI科学家生成的研究论文被接受: 由AI科学家生成的研究论文将在一个主要的机器学习会议或研讨会上被接受。
-
基于GenAI的视频游戏: 一个围绕与GenAI基础元素互动的视频游戏将取得突破性成功。
其他亮点
-
生物学和材料科学: 报告提到了AI在生物学、材料科学、大气科学等领域的应用,强调了AI在药物发现和基因编辑中的潜力。
-
军事和国防: 讨论了AI在军事和国防领域的应用,包括AI技术在乌克兰前线的使用情况,以及AI在国防挑战者中的规模扩大。
-
经济影响: 报告还涉及了AI对经济影响的讨论,包括AI对就业、不平等和宏观经济的影响,以及AI对不同行业的潜在影响。
报告的结论强调了AI技术在全球范围内的快速发展和广泛应用,同时也指出了伴随而来的政治、经济和安全挑战。作者Nathan Benaich和Alex Chalmers通过这份报告,旨在引发关于AI当前状态及其对未来影响的知情对话。报告的目的是提供一个关于AI领域发展的快照,帮助读者理解AI技术的进展,并为未来的技术和社会变革做好准备。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。