type
status
date
slug
summary
tags
category
icon
password
URL
危险还是机遇?确定照片位置的能力在两个方向上都具有巨大的潜力。 PIGEON 和 PIGEOTTO 图像地理定位系统比以前的所有技术都更准确,而且比人类更准确
一组斯坦福大学的学生使用他们的人工智能模型 PIGEON 和 PIGEOTTO 来证明人工智能能够准确预测照片的拍摄地点。这种能力打开了新的大门,但也引起了人们的担忧,即它可能被滥用于监视或跟踪目的。
PIGEON 战胜 GeoGuessr 传奇人物
PIGEON 使用来自 Google 街景的 500,000 多张图像进行训练。该系统需要四张全景图像作为输入,在测试运行中能够在 92% 的时间内猜出正确的国家/地区。
超过 40% 的情况下,它能找到大约 25 英里范围内的位置。
PIGEON 的灵感来自于在线现象 GeoGuessr,其中玩家实际上被传送到随机的街景环境,然后必须在地图上尽可能准确地找到它们。
在连续六场比赛中,PIGEON 甚至连续击败了社区传奇人物 Rainbolt,后者被认为是世界上最好的 GeoGuessr 玩家之一。在 GeoGuessr 总体排名中,PIGEON 名列前 0.01%。
PIGEOTTO 设定新标准
PIGEON 的进步启发了开发人员创建另一种模型。
名为 PIGEOTTO 的第二个模型接受了来自 Flickr 和 Wikipedia 的 400 万张图像的训练,并且只需要一张图像作为输入,而不是街景全景图,这使其成为更强大的图像本地化工具。
因此,可以将其与现有的此类系统进行基准比较。在此,PIGEOTTO 是同类中最好的,并将中值偏差降低了两到五倍。
研究人员明确表示,他们对潜在有用的应用感兴趣,而不是激起人们对滥用该技术的担忧。它可以帮助私人用户找到旧快照。
在科学领域,可以识别入侵植物物种。
科学家们希望通过 PIGEON 和 PIGEOTTO 发起这一领域的重要讨论。 “据我们所知,这是过去五年来第一个不受军事合同资助的现代图像地理定位,”他们总结道。
然而,由于此类技术既可以用于好的目的,也可以用于坏的目的,因此他们决定不发布模型权重。
总结
- 斯坦福大学学生开发的 AI 模型 PIGEON 和 PIGEOTTO 可以准确预测照片的拍摄地点,这既有有用的应用,也有可能被滥用的应用。
- PIGEON 经过超过 500,000 张 Google 街景图像的训练,可以在 92% 的时间内猜出正确的国家/地区,而 PIGEOTTO 经过 400 万张 Flickr 和维基百科图像的训练,只需要一张图像作为输入。
- 研究人员强调,他们希望激发有关此类技术应用的重要讨论。为了限制可能的滥用,他们不发布模型权重。