GPT-4o被全球网友玩坏了谷歌：终究是错付了！-网络百科

在社交软件上，OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入，并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。

在5月14日的官方演示中，GPT-4o展现出了令人印象深刻的性能，其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款AI的多种功能，从生成图表和统计分析到创建3D模型的STL文件，GPT-4o都能在极短的时间内完成。

GPT-4o的应用场景多种多样，网友们的创意层出不穷。例如，有网友使用GPT-4o解答了著名的“爱因斯坦谜题”，展示了其强大的逻辑推理能力。此外，还有网友利用GPT-4o开发了自动选股器，将复杂的选股指标自动改写成选股器，并输出图表和数据归档，极大地提高了效率。

GPT-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始HTML，GPT-4o不仅准确地完成了任务，还保持了数据结构变化时的HTML更新。此外，GPT-4o的OCR（光学字符识别）能力也得到了认可，它能够识别并吐出连人类都难以辨认的图像中的内容。

以下是GPT-4o的一些亮点功能:

多模态输入输出:GPT-4o能够接受文字、音频、图像的任意组合作为输入，并生成相应的文字、音频、图像输出。

逻辑能力测试:GPT-4o成功解答了被称为“爱因斯坦谜题”的逻辑题，展示了其出色的逻辑推理能力。

自动选股器:尽管OpenAI表明GPT不能用于选股，但网友使用GPT-4o创建了一个自动选股器，并能输出图表和数据归档。

纸质原型转录:网友利用GPT-4o将纸质原型转录为电脑内的初始HTML，大大节省了开发时间。

OCR能力:GPT-4o展现了其强大的光学字符识别（OCR）能力，能够识别复杂图像中的文字。

在GPT-4o发布的同时，谷歌也推出了自己的大模型产品Project Astra。尽管Project Astra同样具备强大的功能，但有专家指出，谷歌的产品在多模态输出方面仍有待提高。虽然OpenAI和谷歌都先后推出重磅产品，但这波比拼，谷歌可以说是一点好处都没捞着，直接被OpenAI“艳压”了。

与此同时，马斯克旗下的xAI公司推出的Grok模型在某些测试中表现超过了GPT-4o，比如它正确回答了Ilya离开公司的问题。而OpenAI自己的大模型未能提供正确响应。