openai 正式发布全新开发工具包 agentkit,旨在助力开发者与企业更高效地创建、部署及评估人工智能代理(ai agents)。
此前,开发 AI Agent 通常涉及多个工具的整合,包括手动处理评估流程、编写前端界面以及版本管理等,过程复杂且易出错。AgentKit 的推出正是为了简化这些环节,帮助开发者更快速、稳定地交付高质量的代理应用。
AgentKit 主要由以下几个核心模块构成:
Agent Builder:提供直观的拖拽式可视化编辑器,开发者...
针对埃隆·马斯克声称其xAI游戏团队将在明年发布“革命性AI驱动游戏”的说法,拉瑞安工作室发行负责人Michael Douse近日公开表达了强烈质疑。这位资深游戏行业人士指出:当前市场真正渴求的,并非由算法和心理模型堆砌出的游戏机制,而是更具情感深度与沉浸感的虚拟世界。
马斯克近日在社交媒体上宣称:“xAI游戏工作室计划于明年年底前推出一款卓越的AI生成游戏。”然而,Douse对此并不买账。他在评论中直言:
“这个行业最不需要的,就是更多靠数据建模、心理学操控设计...
openai 宣布其 ai 编程助手 codex 正式进入全面可用阶段(general availability),同时为团队和企业级开发者推出三大关键升级。
第一项更新是与 Slack 的深度集成。现在开发者可以在 Slack 聊天中直接 @Codex,使其根据对话上下文生成代码、排查错误、执行修复,并提交更改,实现无缝协作,无需在不同工具间频繁切换。
第二项是全新推出的 Codex SDK,支持结构化响应输出、上下文记忆管理以及自定义功能集成。借助该 SDK,...
10 月 9 日消息,据《商业内幕》今日报道,谷歌通知员工,若希望获得健康福利,必须授权第三方 ai 医疗平台访问其个人数据,此举已引发部分员工强烈不满。拒绝共享数据者将被剥夺享受任何健康保障的资格。
根据《商业内幕》获取的内部文件显示,谷歌在本月宣布,美国地区的员工若想在即将开启的报名期内通过母公司 Alphabet 注册健康福利计划,就必须同意让由 Nayya 提供的人工智能工具访问其相关信息。
文件指出,任何拒绝使用 Nayya 系统的员工,将无法参与 Alph...
中国信通院于日前正式发布新版本“方升”基准测试体系3.0。
“方升”大模型基准测试体系3.0在原有基础上实现系统性跃升,新增模型基础属性测试,对参数规模、推理效率等底层特征进行体系化测试;同时前瞻性布局未来高级智能测试,围绕全模态理解、长期记忆、自主学习等10项高级能力构建评估能力,并进一步深化工业制造、基础科学、金融等重点行业的场景化评测。
为支撑“方升”3.0的实施,中国信通院将从以下几方面系统强化评测基础设施:
一是扩容高质测试数据资源,围绕复杂推理、多模态...
谷歌近日推出了一款名为“gemini 2.5 computer use”的新型模型,该模型基于gemini 2.5 pro打造,具备强大的“视觉理解与推理能力”,能够解析用户指令并自主执行相应任务。其核心亮点在于实现ai智能体与图形用户界面之间的自动化交互,进一步拓展了谷歌在ai操作生态领域的布局。
据悉,该模型融合了先进的视觉识别与逻辑推演技术,可模拟人类在浏览器中的多种操作行为,包括点击、输入、滚动等共计13种动作。即使面对缺乏API接口的网页环境或涉及多页面跳...
blender 5.0 beta 版本现已开放测试,正式版预计于 2025 年 11 月 11 日上线。本次更新对用户界面进行了全面优化,动画工作区默认以摄影表替代传统时间轴,进一步提升动画制作与管理效率。
节点编辑器也迎来视觉革新,阴影效果更加紧凑,节点分组堆叠结构更清晰易读。同时,系统精简了逾 300 项主题配置选项,统一了工具栏与侧边栏的视觉风格与交互逻辑。渲染方面,EEVEE 与 Cycles 引擎现已完整支持 HDR 和广色域色彩空间,并引入 Nano...
10月9日最新消息,微星b850m power主板已正式上市,定价为1599元,首发时迅速售罄,目前仍处于供不应求状态,需参与抢购才能入手。
这款热门新品现已抵达我们评测室,接下来为大家带来详细的图赏内容。
微星B850M POWER主板采用高端的8层服务器级PCB设计,配备双8PIN供电接口,并使用实心针脚工艺,保障出色的电气性能与稳定性。
该主板全面支持最新的AMD 锐龙9000系列桌面处理器,提供85°C、75°C和65°C三档温控选项,用户可根据需求设定CP...
Anthropic 宣布正式发布并开源一款名为 Petri 的新型工具,该工具基于英国人工智能安全研究所(AISI)开发的“Inspect”评估框架,致力于通过 AI 代理实现对 AI 模型安全性的自动化审计。
公司指出,当前 AI 系统的行为复杂度已远超研究人员手动测试的能力范围。为此,Petri(全称为“风险交互并行探索工具”)应运而生,旨在填补这一能力空白。
在 Petri 的工作流程中,研究人员首先输入一条自然语言形式的“种子指令”,描述希望测试的具体场景...
阿里通义千问大模型团队技术负责人林俊旸近日在社交平台上透露,qwen 内部已悄然成立一个专注于机器人与具身智能的小型研发团队。他进一步指出:
多模态基础模型正在演变为具备工具调用与记忆能力的基础智能体,能够通过强化学习实现长周期推理。这类智能体,理应从数字空间迈向真实物理世界。
在全球科技企业加速布局机器人赛道的背景下,阿里云首次涉足具身智能领域——上个月,其领投了中国本土机器人初创企业自变量机器人(X Square Robot)高达 1.4 亿美元的融资轮次。
值得...