大模型技术创新,泰华智慧在行动

年伊始,DeepSeek引发的冲击波并未随着春节假期的结束而消散,反而愈演愈烈通过FP8训练、多词元预测、改良MOE架构、多头潜在注意力机制(MLA)、无SFT强化学习等方法,DeepSeek-V3以极低的训练成本实现了超越Qwen2.5-72B和Llama-3.1-405B等顶尖开源模型和部分闭源模型的性能,DeepSeek-R1更是表现出了超越OpenAI o1的推理效果。

DeepSeek系列模型的成功,为原来以算力为核心逻辑驱动的大模型行业开辟了新的道路,让全球的基础型大模型迈上了一个崭新的台阶。然而,在DeepSeek等以“技术叙事”为主旋律的基础型大模型之外,围绕核心产品、核心场景进行AI技术创新的应用型大模型也应重视。

 

 

近日泰华智慧产业集团股份有限公司(以下简称“泰华智慧”)召开技术探讨会,就基于大模型技术的产品研究与探索进行了内部交流上,泰华智慧照明技术研发中心其基于大模型的“智慧照明AI智能助手”开发经验进行了分享,对智能问答、知识查询、语音控制等产品原型进行了展示。随后各参会术专家基于大模型技术的场景应用、模型选择、数据安全等问题进行了热烈讨论

泰华智慧作为国内领先的智慧城市解决方案提供商,始终致力于人工智能技术的研发与应用。此次会议标志着泰华智慧已全面开展大模型应用研发工作,积极推动人工智能技术与智慧城市建设的深度融合。下一步,泰华智慧结合行业应用场景在检索增强生成、工具调用、大小模型协同、大模型微调等方面展开全面探索,赋能各业务产品升级为构建更加智能、便捷、宜居的城市环境贡献力量

发布时间:2025-02-21