文心大模型4.0首发 四项关键能力显著提升
科技日报记者 刘艳
10月17日,文心文心大模型4.0在“百度世界2023”发布并开启邀请测试,大模搜索、型首显著如流、发项地图、关键网盘、提升文库等百度AI原生应用以全新面目亮相。文心
百度首席技术官王海峰说:“文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,大模在多个关键技术方向上进一步创新突破。型首显著理解和生成能力提升幅度相近,发项逻辑和记忆能力的关键提升更大,逻辑的提升提升幅度达到理解的近3倍,记忆的文心提升幅度也达到了理解的2倍多。自9月开始小流量上线,大模过去一个多月效果又提升了近30%。型首显著”
谈及文心大模型4.0,百度创始人、董事长兼首席执行官李彦宏难掩自豪:“这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,综合能力与GPT-4相比毫不逊色。”
这么显著的效果提升是怎么实现的?
王海峰介绍,技术人员在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练;建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果;基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐;可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。
据了解,在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。
当下,大模型已成为人工智能发展的热点方向和新型工业化的重要推动力,但应用层面的挑战始终存在,如何破除大模型进一步普及的阻碍?
“过去一年,科技领域最大的创新是大模型带来的智能涌现,并成为开发AI原生应用的基础。”在李彦宏看来,AI原生应用,就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用,而这些能力是过去时代所不具备的,因此才能打开无限的创新空间。
今年5月,百度提出用AI思维重构所有产品,做出AI原生应用,“百度世界2023”大会上,百度通过展现基于文心大模型技术土壤重构的十余款AI原生应用,给出了大模型应用落地的有效路径。
(百度供图)
- ·预约火爆 部分博物馆增设夜间开放
- ·走进农家书屋丨湖北赤壁:164个乡村振兴“小智库”全覆盖
- ·以青春活力共创美好未来——成都第31届世界大学生夏季运动会闭幕式侧记
- ·中疾控:7月新增猴痘确诊491例,专家解读突增原因
- ·新春走基层丨厦门:“茶园+碳汇”点亮山居生活
- ·从意图入手解决实际问题 海南大学研发人工意识原型系统
- ·蔬菜专家小分队驰援受灾生产一线
- ·广州黄埔:推出100项“一件事”主题集成服务
- ·全球首次使用物理方法高效分离手性物质
- ·我们生活的宇宙之外是否还有其他宇宙存在?
- ·国家能源集团宁夏煤业成功产出新牌号聚丙烯产品
- ·以“汛”为令 闻“汛”而动——天津全力抗击汛情扫描
- ·脚气克星!我科研团队开发基于黄光+超声的真菌快速清理技术
- ·江苏:制造强省助推现代化产业体系向“实”而行
- ·从首届科技节 看贵州的科创决心
- ·深瞳丨4万年前,水洞沟人是怎么生活的