技术评测
-
阅读人工智能评论:这款人工智能可以在视频通话中读取情绪
您是否曾在视频通话结束后,疑惑自己的语气如何,或对方对此次对话的真实感受如何?想象一下,如果您能立即理解对方所说的内容及其背后的情感,那该有多好! 我最近遇到了Read AI,这是…
-
使用 LlamaIndex 和 Gemini 实现 REAcT Agent
在过去的 2-3 年里,我们见证了人工智能领域的非凡发展,主要体现在大型语言模型、扩散模型、多模态模型等方面。我最喜欢的兴趣之一是代理工作流。今年早些时候,Coursera 的创始…
-
利用人类注意力可以改善人工智能生成的图像
来自中国的一项新研究提出了一种提高稳定扩散等潜在扩散模型(LDM)生成的图像质量的方法。 该方法专注于优化图像的显著区域——最有可能吸引人类注意力的区域。 新研究发现,显著性图(左…
-
针对 3D 高斯溅射的投毒攻击
新加坡和中国之间的一项新研究合作提出了一种攻击流行合成方法3D Gaussian Splatting(3DGS)的方法。 新的攻击方法使用精心设计的源数据来超载目标系统的可用 GP…
-
通过换脸变身杰克·斯派洛
现在,内容创作者面临着比以往任何时候都更加强烈的快速高效地制作高质量视觉效果的需求。 您是否知道,当今营销人员面临的两大内容营销挑战是制作高质量内容和持续生成此类内容?这并不奇怪,…
-
使用 JPEG 压缩来改善神经网络训练
加拿大的一篇新研究论文提出了一个框架,该框架有意将 JPEG 压缩引入神经网络的训练方案中,并设法获得更好的结果以及更好的抵抗对抗性攻击的能力。 这是一个相当激进的想法,因为目前的…
-
从微调稳定扩散模型中提取训练数据
美国的新研究提出了一种从微调模型中提取大量训练数据的方法。 当艺术家的风格被抄袭,或者受版权保护的图像被用于训练公众人物、受知识产权保护的角色或其他内容的生成模型时,这可能会提供法…
-
利用人工智能节省照片筛选时间
如果您是摄影师,没有什么比在大型活动或拍摄后整理数百张(甚至数千张)照片更耗时的事情了。您是否知道专业摄影师平均每小时拍摄一次,要花 3-4 个小时进行编辑? 我最近偶然发现了Af…
-
什么是 ChatGPT Canvas?Claude Artifacts 的替代品
OpenAI 最近推出了一项令人印象深刻的功能,名为ChatGPT Canvas。与我们已经习惯的普通聊天窗口不同,ChatGPT Canvas 为处理复杂项目提供了更强大、更具协…
-
Google Lens 现在可以回答有关视频的问题
谷歌正在升级其视觉搜索应用程序 Lens,使其能够近乎实时地回答有关您周围环境的问题。 安装了Google 应用的英语 Android 和 iOS 用户现在可以开始通过 Lens …