AI产品测评-这里有最详细的人工智能工具测评解析

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

收到面壁智能的内测邀请,我翻了翻产品逻辑,发现它想解决的问题和我当时的处境一模一样。AI 能不能不只是回消息,而是做项目。AI 能不能记住规则,能在你睡觉的时候继续干活,能自己发现你漏了什么。

来自主题: AI产品测评
8478 点击    2026-05-28 17:52
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
8915 点击    2026-05-28 12:06
实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

迈入今年618大促周期,各大电商平台纷纷加码AI购物,智能选购成为各家角逐的新焦点。

来自主题: AI产品测评
8339 点击    2026-05-28 10:20
实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

AI 短剧发展到今天,过去那种靠单打独斗的小作坊模式正在被淘汰。现在复盘榜单上排名靠前的AI短剧内容团队,你会发现里面基本都是几个人、甚至十几人的工作室在共同推进项目。

来自主题: AI产品测评
9535 点击    2026-05-26 16:05
实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

下一代创作软件比的不是模型能力,而是谁能把完整的创作流程跑通。 能让 Agent 从接到目标开始,一路协作推进到交付成品的系统,才是真正的竞争力。 OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」,面向创作工作的 Agent 操作系统。

来自主题: AI产品测评
7895 点击    2026-05-25 15:05
中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

AI办公彻底变天了!阿里QoderWork重磅发布全球首个AI Native自定义工作台,推出设计、PPT、写作三大领域模式。AI办公正式从「对话驱动」走向「领域驱动」。

来自主题: AI产品测评
10067 点击    2026-05-22 09:57
Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

昨天,想必大家都被 Google IO 大会刷屏了。

来自主题: AI产品测评
9089 点击    2026-05-22 09:56
体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

大家好,我是袋鼠帝 作为一名后端程序员,我略懂前端,但是对于UI设计是一窍不通。

来自主题: AI产品测评
7682 点击    2026-05-21 16:10
全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?

来自主题: AI产品测评
8368 点击    2026-05-21 09:48
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。

来自主题: AI产品测评
10032 点击    2026-05-16 11:08
一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

把 Agent 从单体,组成一支可以协作的 Agent Teams。

来自主题: AI产品测评
11905 点击    2026-05-14 14:27
实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice,在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理(接入词元跳动注册即送免费算力):她有完整的人设,26 岁澳门女生,会在凌晨提醒你早睡,还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评
8378 点击    2026-05-10 22:14
千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。

来自主题: AI产品测评
10584 点击    2026-05-03 08:49
国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

从去年开始做这个账号以来,我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。但从过年之后,真的就很少写模型评测的文章了。主要是我写文章的速度甚至一度跟不上模型发布的速度了。

来自主题: AI产品测评
10083 点击    2026-05-02 11:01
实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一

来自主题: AI产品测评
9796 点击    2026-05-01 10:51
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。

来自主题: AI产品测评
9432 点击    2026-04-29 19:51
小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

没错,用的就是主打长程任务、模糊指令遵循,跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型,综合实力对标国际顶尖水准。

来自主题: AI产品测评
6881 点击    2026-04-29 10:04
DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。

来自主题: AI产品测评
8015 点击    2026-04-25 09:56
实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

AI第一次从包工头,变成了建筑设计师。

来自主题: AI产品测评
6783 点击    2026-04-24 10:09
做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

上次 Ribbi 刚开始内测的时候,好友 Joanna 就给了我邀请,东忙西忙没来得及体验,这两天玩上了,也是感受到了这个小青蛙的魅力了。

来自主题: AI产品测评
7822 点击    2026-04-23 10:06
实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

用AI跑批量任务的人,手里基本都有一个干活的模型,不是最聪明,但要快、要便宜,稳定不出岔子。

来自主题: AI产品测评
7139 点击    2026-04-22 16:36
Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Kimi 刚刚发布了 K2.6,Agent 模式也同步大升级。

来自主题: AI产品测评
8407 点击    2026-04-21 16:58
阿里官宣上线Happy Oyster,全网首发实测!

阿里官宣上线Happy Oyster,全网首发实测!

阿里官宣上线Happy Oyster,全网首发实测!

前段时间有个叫 Happy Horse 的模型实火了一把,在知名 AI 评测分析平台 Artificial Analysis 上,直接把 Seedance 2.0 挤到了第二。

来自主题: AI产品测评
6699 点击    2026-04-20 09:05
实测Claude Opus 4.7,好好的模型也开始不说人话了。

实测Claude Opus 4.7,好好的模型也开始不说人话了。

实测Claude Opus 4.7,好好的模型也开始不说人话了。

果不其然,最近一周Claude天天崩,就是为了新模型做储备。

来自主题: AI产品测评
6110 点击    2026-04-17 08:39
小时候追的超兽武装,被 AI 一点点带到了现实里

小时候追的超兽武装,被 AI 一点点带到了现实里

小时候追的超兽武装,被 AI 一点点带到了现实里

前两天我刷到一个工具的时候,第一反应其实不是拿真人照片试,也不是拿潮玩图试。

来自主题: AI产品测评
10413 点击    2026-04-14 14:58