所有博文

  • Published on
    三星手机默认启用谷歌Gemini取代Bixby,标志着谷歌在AI助手领域的重大胜利。Gemini凭借其强大的功能和广泛的集成,正在迅速超越竞争对手,成为市场领导者。谷歌通过在各种产品中部署Gemini,并利用其在安卓系统中的深度集成,正在巩固其在人工智能助手领域的地位。
  • Published on
    本文总结了福布斯商业委员会20位成员的建议,旨在帮助专业人士有效进入人工智能或生成式人工智能领域。建议涵盖从基础概念学习到实践项目参与,以及伦理考量和商业应用等多个方面,为有志于进入AI领域的专业人士提供了宝贵的指导。
  • Published on
    一项研究表明,当前的人工智能模型在理解世界历史方面存在显著缺陷,准确率仅为46%。这引发了人们对人工智能在知识理解和推理能力方面的担忧,并促使我们重新审视其在教育、研究等领域的应用前景。
  • Published on
    本文深入分析了中国人工智能聊天机器人市场的现状,重点探讨了字节跳动旗下“豆包”的崛起及其成功因素,并对比了百度“文心一言”面临的挑战。文章还探讨了市场碎片化加剧竞争的趋势,以及未来市场发展的关键要素。
  • Published on
    前OpenAI高级语音模型研发者Alexis Conneau创立的WaveForms AI,致力于开发情感通用智能(EGI)音频大型语言模型,并获得4000万美元种子轮融资。该公司采用端到端音频处理技术,旨在实现更自然、更人性化的人机交互。
  • Published on
    月之暗面发布Kimi k1.5多模态模型,在数学、代码和多模态推理能力上全面对标OpenAI的满血版o1,成为OpenAI之外首个达到此高度的模型。该模型在短链思维领域达到SOTA水平,并公开了其强化学习训练技术细节,展现了中国在人工智能领域的重大突破。
  • Published on
    OpenAI正计划推出博士级超级AI Agent,引发业界对AI取代中级软件工程师的担忧。Meta和Salesforce等公司已开始采用AI Agent提高生产力,并计划减少软件工程师招聘。超级AI Agent具备自主设定目标、处理复杂问题的能力,其核心技术包括机器学习、自然语言处理和复杂系统建模...
  • Published on
    OpenAI近期分享了一个基于实时API开发的多层级高级AI Agent项目,令人惊讶的是,这个语音智能体应用原型仅用了20分钟就完成了开发。该实时Agent具有实时响应、多层级协作框架、灵活的任务交接和状态机驱动的任务处理等技术优势,并采用大模型辅助决策。此外,它还提供了可视化WebRTC界面和...
  • Published on
    本文探讨了在扩散模型推理过程中进行扩展的新范式,通过增加计算资源和优化采样噪声,显著提高了生成样本的质量。研究引入了验证器和算法两个核心组件,并探索了随机搜索、零阶搜索和路径搜索等算法,以优化采样过程。此外,该研究还考察了文本到图像生成任务中搜索框架的扩展能力,以及不同验证器和算法组合对生成质量的...