AI基准测试
-
AI基准测试平台Chatbot Arena成立新公司
在人工智能领域,随着技术的不断进步和应用场景的日益拓展,各类创新平台应运而生。近日,备受瞩目的AI基准测试平台Chatbot Arena宣布成立一家新公司,旨在进一步提升AI技术的…
-
OpenAI发布o3和o4-mini:能“用图像思考”并自主使用工具的AI模型
OpenAI近日宣布推出两款具有革命性意义的AI模型——o3和o4-mini,这些模型不仅能够通过图像进行推理,还能自主使用各种工具,标志着人工智能能力的一大步飞跃。这两款模型是O…
-
超级马里奥成AI新基准测试工具
近年来,人工智能(AI)领域的发展日新月异,各类基准测试工具层出不穷,用于评估AI模型的性能。而近日,一个令人意想不到的角色——超级马里奥,竟也加入了这一行列,成为衡量AI能力的新…