Carlos Osorio, Democratic presidential nominee Vice President Kamala Harris and her running mate, Minnesota governor Tim Walz, arrive for a campaign rally in Romulus, Michigan, on August 7, 2024. Former president Trump falsely claimed this image featuring a large crowd was AI generated.Courtesy AP Photo
1984年,弗雷德·里钦(Fred Ritchin)在《纽约时报杂志》(New York Times Magazine)上发表了一篇文章,题为《摄影的新把戏包》(Photography’s New Bag of Tricks),这是关于数字技术如何改写图像制作规则的早期反思和警告。那时,Photoshop还要几年才能上市,而数字成像在当时需要极为昂贵的设备。尽管如此,里钦已经看到了这些对图片制作方式的改变可能会颠覆纪实摄影和新闻报道领域的规则。当然,照片一直以来都被人为操控——用于政治宣传、广告或艺术实验——但如今,这样的干预变得更容易实现,也更难以察觉。这将对照片作为记录事件的可靠信使的能力意味着什么?
AI-generated image: Taylor Swift appearing to support Donald Trump, 2024
AI-generated image: a deepfake of Elon Musk used in a cryptocurrency scam, 2024
布赖恩·帕尔默:有人认为,摄影图像已经失去了任何可信度。人工智能的干预对纪实摄影意味着什么?
弗雷德·里钦:如果我们曾经拥有一种既可信又有用的视觉货币,它能够改善数百万人的生活,帮助战争更早结束,促进民权,以及在疾病、饥荒、地震或其他重大问题发生时推动全球干预,那么与其仅仅说它在可信度上被削弱了——确实如此——我认为更合适的问题是:如何恢复它作为见证的信任?一些解决方案是技术性的,许多涉及增加背景和作者身份以及协作,还有一些需要对媒介进行更加创新的使用。
帕尔默:如果我是一个年轻的新晋纪实摄影师,为什么我应该关心描绘我面前的世界,而不是做其他事情,比如利用数字技术创造镜头中不存在的东西?能给我一些具体的例子,无论是过去还是现在的。
里钦:在过去,有许多摄影被用来引发积极变革的例子,现在的挑战是延续这一传统,这可以称之为一种建设性的启示(constructive illumination)。
例如,1968年,当艾迪·亚当斯(Eddie Adams)拍摄了一张疑似越共成员在街头被处决的照片后,第二年,美国撤出了大量的士兵。1972年,一张由越南摄影师阮进勇(Nick Ut)拍摄的九岁女孩潘氏金福(Phan Thi Kim Phúc)被凝固汽油弹烧伤的照片传播后,第二年,美国撤出了所有驻越士兵。这两张照片——一张来自外部人士,另一张来自越南人——都极大地推动了反战运动。这不仅仅是关于摄影的讨论,也是关于它作为一种媒介在世界上的有用性,它有时能够支持积极的变革,并作为一个参考点让人们看到并同意某些事情正在发生。
照片在吸引人们关注各种虐待问题方面极为有用——比如在阿布格莱布监狱(Abu Ghraib)中对伊拉克囚犯的酷刑,美国摄影师唐娜·费拉托(Donna Ferrato)拍摄的关于美国家庭暴力的照片,以及2015年艾伦·库尔迪(Alan Kurdi)试图逃离叙利亚途中溺亡的照片。这张照片可能是最后一张能够促使世界产生持续、建设性反应的标志性照片。
Nick Ut, South Vietnamese forces follow after terrified children, including nine-year-old Kim Phúc, center, as they run down Route 1 near Trang Bang after an aerial napalm attack on suspected Viet Cong hiding places, June 8, 1972. Courtesy AP Photo
帕尔默:我们如何区分新闻摄影与其他类型的图像?
里钦:新闻摄影需要成为一种可以称之为“外貌引述”(quotation from appearances)的东西,这是约翰·伯格(John Berger)曾提出的一个概念。图片的边框可以被视为引号,任何超出轻微修图或裁剪,或去除一些如视觉噪点等瑕疵的修改,都需要向读者标明,就像在文字引用中,任何添加或删除的内容都需要用省略号或方括号标明一样。
如果你把摄影师视为图像的作者,就像作家是文本的作者一样,人们可以从外貌中引用,而当图像不再是引用时,必须通过标题或其他形式的标注将其透明化地呈现给观众。如果有人想用人工智能生成逼真的图像并将其用于纪实环境中,那就必须以显著的方式标明。例如,我会写道:“这是一个合成图像,而非一张照片(This is a synthetic image, not a photograph)。”然后我会描述这张图像是如何通过人工智能系统根据文本提示生成的。
AI-generated image: “All Eyes on Rafah,” which went viral on Instagram in 2024
Courtesy Zila Abka/ Microsoft Image Creator
帕尔默:正如你所指出的,人工智能只是几十年来数字技术演变中的最新发展。它本身既不是坏的也不是好的,但在某些情况下的使用可能确实是非常具有破坏性的。在新闻摄影中,我们应该在哪里划清界限?
里钦:让我们稍微退后一步。在20世纪,摄影主要是“光学的”(optical)——光线通过镜头并记录在胶片上。随着数字成像的发明,摄影变得越来越“计算化”(computational)——光线通过镜头仅仅是一个起点,然后通过像素的不可察觉的操控来创造一些完全不同的东西,这种操控通常被描述为“增强”(enhanced)。
这可以通过后期制作的软件完成,或者像现在常见的那样,通过相机内部的算法立即修改图像,表面上是为了取悦消费者/摄影师,或者“高级用户”(prosumer)。这种情况尤其在手机摄影中明显——手机现在生产了超过90%的照片。于是问题出现了:我们是否仍应该称之为“摄影”(photography),还是使用更广泛的术语,比如“成像”(imaging)?
如今,利用生成式人工智能(generative artificial intelligence),既不需要镜头也不需要相机来制作逼真的图像。计算机系统可以在几秒钟内根据文字提示生成几乎任何东西。这样做不仅可以使从未存在的人物和事件看起来和实际发生的一样真实,还越来越使人们怀疑这些合成图像所模仿的照片的可信度。如果几乎任何场景都可以在几秒钟内生成,并且看起来像一张照片,那么照片本身的价值是什么?如果摄影师必须亲临现场拍摄,而在家里却可以召唤出一个类似甚至更生动的场景,那还有什么意义?
帕尔默:我们是否真正理解人工智能对我们的深远影响?
里钦:生成式人工智能(Generative artificial intelligence)代表了一种范式转变。它可能模拟摄影,但现场不再有见证者,也不再有相机,这与纪实摄影不同。然而,当生成式人工智能被适当标注时,它也可以非常有用,用来描绘摄影无法覆盖的领域——比如未来或遥远的过去。
帕尔默:让我用一个我们过去几十年来多次讨论过的词来框定我的问题:民主(democracy)。你早在1984年就通过你在《纽约时报杂志》(New York Times Magazine)上的文章《摄影的新把戏包》(Photography’s New Bag of Tricks)开始警告软件可能被用来篡改我们所认为的非虚构文献。为什么新闻摄影对民主如此重要,尤其是在当下?
里钦:如果我们不知道世界上正在发生什么,如果我们没有共同的参照点,就无法决定如何投票,投票给谁,甚至无法对正在发生的事情形成观点。正如许多人此前警告的那样,包括汉娜·阿伦特(Hannah Arendt),当公民变得足够困惑时,实际上就等于被“解除武装”,这会导致独裁者的崛起,由他们来为公众做决定。
Tanya Habjouqa, Occupied Palestinian Territories, West Bank, Qalandia, 2013. After grueling traffic at the Qalandia checkpoint, a young man enjoys a cigarette in his car as traffic finally clears on the last evening of Ramadan. He is bringing home a sheep for the upcoming Eid celebration. Courtesy Noor Images
帕尔默:在纪实领域是否有任何积极的发展?
里钦:在更民主的媒介方面,一个积极的发展是,我们现在可以看到来自世界各地人们的图像,他们对自己的文化和处境有更多的洞察力。纪实摄影不再那么频繁地被利用,就像摄影师兼教师梅尔·罗森塔尔(Mel Rosenthal)所描述的那样,作为一种“向下移动”的方式——中产阶级或上中产阶级的摄影师去拍摄贫穷或边缘化的人群。
帕尔默:我还没准备好承认生成式人工智能在非虚构摄影中有什么作用,但你认为有哪些方式可以用它来传递信息或激发灵感,而不是用来欺骗?
里钦:生成式人工智能的一个有趣方面是,虽然它经常被批评为种族主义、厌女和荒谬(racist, misogynistic and idiotic),但很多时候,它通过文字提示生成的图像超越了我们脑海中的刻板印象。相较于那些经常模仿之前照片的传统摄影,这些结果往往令人惊讶。在许多情况下,生成的图像让我重新思考自己对美、贫困、可能性的预期,等等。
帕尔默:你让我想起我在伊拉克的一次经历。当时,一位来自一家大型新闻杂志的编辑问我是否拍摄了最近巴格达(Baghdad)的一次公交车爆炸事件的照片,而当时我在距离现场四五十公里的地方,这需要八个小时才能到达;这完全是与我的现实脱节的情境。这是一个为寻找照片插图或现实主义照片叙事而存在的故事,而这个叙事往往是为了满足全球北方对全球南方的特定描绘。这种传统仍然存在——无论是关于种族、阶级还是殖民主义——白人以特定方式描绘有色人种。这是问题的一部分。我认为,透明性以及对单个摄影师观点的质疑可以缓解这种倾向。
里钦:我完全同意。如果我现在负责编辑一本刊物,我会呈现来自世界各地平民的图像,这些图像由他们为我们提供背景信息。比如,在最近的奥运会期间,巴黎(Paris)是什么样的?让我看看来自75位背景各异的巴黎人的手机图像,而不仅仅是奥运会比赛本身那些大多可以预测的拍摄方式。他们可以告诉我们关于奥运会电视制作表面之外正在发生的事情。
AI-generated image: the Pope wearing a Balenciaga puffer jacket, 2023
帕尔默:以凯文·卡特(Kevin Carter)拍摄的苏丹(Sudan)饥饿儿童与盘旋在旁的秃鹫的标志性照片为例。我们可以质疑这张照片,因为它是真实的图像。这是真实现实的引述(quotation from reality)。我们可以批评它,可以支持它,可以做任何解读,但我们有一个参照点,并且我们知道它是通过特定的方法制作的:人类用相机与真实存在的血肉之躯、砖瓦世界互动。这不是通过从元宇宙(metaverse)中抓取的零和一生成的。这种“引用现实”的形式是否以一种生成式人工智能无法做到的方式服务于民主?
里钦:是的,人工智能颠覆了一切,因为你不再需要相机,不需要前往苏丹。它所参考的是可以在线找到的现存图像。例如,AI生成的公司CEO图像,通常以前都是白人男性,如今AI公司已经做了很大努力来改变算法。但现在的结果有时同样扭曲,比如你可能会看到身穿纳粹军服的黑人士兵,或者在我的案例中,我请求生成一幅“南北战争后美国南方的白人种族隔离主义者”(white segregationists in the South after the Civil War)的图像,结果生成的却是一群黑人男子的画面。想象一下高中生为研究论文搜索类似内容时得到的结果。
帕尔默:这会对我们的社会造成什么样的影响?
里钦:在某种程度上,我们曾通过摄影分享现实。如今,如果照片如此容易被模拟,以至于我们可以根据自己的意愿随意定义图像所要表达的内容,那么为什么还要对真实的照片作出回应呢?它们失去了分量和可信度。一些人称之为“谎言红利”(the liar’s dividend),另一些人称之为“搅浑池水”(poisoning the well)。
而且,反过来说,合成图像可以被轻松武器化,用来“展示”另一方——无论是哪个对立方——犯下的暴行。人们不再需要亲眼目睹,就可以凭空捏造出来。一位我的学生指出,在亲以色列和亲巴勒斯坦的网站上都存在虚假图像,当她指出这一点时,许多人的反应是,他们已经知道了“真相”,一张图像是否真实并不重要。
我们现在生活在一个不同的时代。“相机永不说谎”(The camera never lies)这一观点即使作为一种神话也不再站得住脚。这也是为什么你和我最近共同发起了“用光书写”(Writing with Light)活动,这一活动重视摄影师作为图像作者的诚信,而非仅仅关注图像是否通过相机拍摄。我们必须更加努力地向公众解释各种图像类型之间的差异,包括它们是如何制作的以及由谁制作的。我们需要一个广泛的运动来帮助恢复对共享现实的认知,同时为我们对“真实”的定义增加更多的细微差别和复杂性。
声明:本文内容仅用于学习和交流目的,版权归原作者所有。为了获得最准确的信息和完整的内容理解,建议读者参阅原文。本文翻译可能存在细微差异,敬请谅解。