▲ 喜欢的话各位转发一下吧!作者联系方式在文章末尾
第一章的总结
• 研究背景:从哲学角度探讨体育科学中应用人工智能(AI)可能产生的影响,AI在体育科学中的应用受商业驱动,且数据和分析工具的易得性使其对科学和商业都具有吸引力。
• 主要内容:
• Mathematization - Digitization - Artificial Intelligence(数学化 - 数字化 - 人工智能):
• 术语及相关概念:AI处理人类智能所涉及的任务,近期的成功主要源于深度学习和多层人工神经网络(ANNs)的使用;ML通常包括多种方法,如Deep Neural Networks;AI不仅有助于解决问题,还影响问题的提出方式,因为使用AI会使研究人员以适合AI的方式来表述问题。
• AI与科学研究的关系:AI至少包含两个层面,计算机是研究数学或形式结构行为的工具,而数学结构也是研究世界中物体行为的工具,AI是数字化的一部分,数字化又是数学化的一部分;从伽利略关于自然之书的论断开始,现代科学朝着数学化的方向发展,计算机的出现重新定义了数学工具,模拟作为计算机仪器的一个主要领域,具有实验性、探索性、可塑性和认知不透明性等特征;ANNs是一种特殊类型的模型,其结构通常与目标现象无关,但包含大量参数,其调整使整体行为非常多样化,ANNs代表了数学化的一个转变,现在的数学化关注的是工具的数学化。
• Epistemology: Opacity and Understanding(认识论:不透明性与理解):黑箱模型只关注输入 - 输出行为,而白箱模型还关注模型的内部运作;人们普遍希望用透明模型取代不透明模型,但ANNs的快速发展带来了预测成功的同时也带来了不透明模型,目前XAI仍是一个开放的研究领域;从历史和哲学的角度来看,预测挑战了对解释的追求,新的方法似乎颠覆了这一点,理解在认识论中是一个重要但模糊的概念,模拟模型可以在一定标准上提供理解,尽管它们在认识论上可能不透明,但仍可以提供控制动态的手段,这可能会导致科学理解的新概念或重新定义。
• Software and How Expertise is Organized(软件与专业知识的组织方式):研究人员使用模拟或其他计算方法需要适当的基础设施,包括数据、网络和软件;ANNs的数据消化能力依赖于硬件和软件的结合,其对相关性的敏感性需要大量数据支持,这使得研究人员倾向于研究有大量数据可用的领域;软件的易用性导致了劳动分工的根本转变,AI中存在许多竞赛,吸引了不同群体的关注,数据和软件的提供方式以及预测质量对政策和监管产生了影响。
• 研究结论:数字化带来了新的研究工具,其广泛应用依赖于基础设施,使非专家也能使用软件,同时引导新的研究转向适合这些新工具的领域和问题;哲学上,模拟和AI方法具有认知不透明性,它们能产生预测,但在解释方面往往不太乐观。
如果您喜欢本文的话并认可我的内容的话,欢迎您将本文转发给身边的人或是朋友圈,每次看到文章的转发和阅读量就能感受到各位对我最大的支持!
本文的后续章节,请关注 #《体育、运动与健康领域的人工智能》 合集
全文如下
作者联系方式放在末尾了
第 1 章:将体育科学置于数字化运动之中
作者:约翰内斯·伦哈德
摘要:本章思考了体育科学中的人工智能(AI)在更广泛的数字化运动中的位置,而数字化在数学化中又占据着特殊的地位。它探讨了这样一个问题:如果一个领域正在进入 AI 领域,从哲学的角度来看,这可能会产生什么潜在影响?它认为认知不透明性是数字化的一个重要组成部分,更是 AI 的一个重要组成部分。这使得预测成为科学成功的一个更重要的标准,而解释能力则严重减弱。最后,本章探讨了软件的使用如何导致科学的新社会组织形式。
关键词:体育科学;模拟建模;认识论;数学化;数字化
▲ 本书来源
1.1 引言
如今,数字化主要是从人工智能(AI)的角度来讨论的。本章将退后一步,思考体育科学中的 AI 如何在更广泛的数字化运动中定位,而数字化运动在数学化中又占据着特殊的地位。本章的目的不是提供 AI 在体育科学中当前或未来应用的概述。本书的其他贡献以一种恰当的方式做到了这一点。它也不会充当哲学上的否定者——询问 AI 是“新的黎明还是虚假的希望”在文献中是一个热门话题(对于体育科学,见巴特利特,2006)。相反,下面的文本探讨了这个问题:如果一个领域——体育科学或任何其他领域——正在进入 AI 领域,这可能会产生什么潜在影响?
AI 这个标签比最近的机器学习(ML)方法更古老。当这个标签于 1956 年在达特茅斯的一次会议上被创造出来时,正如会议组织者之一的约翰·麦卡锡后来(1988 年)提醒的那样,它主要应该避免与当时流行的控制论术语有任何关联。在 20 世纪 50 年代,人工智能的支持者认为,遵循明确的规则是实现智能的关键。由于数字计算机是一种能够轻松快速地处理这些规则的机器,因此人们预计人工智能将在可预见的时间内超越人类智能。但事实证明,人工智能并没有达到这些预期,这是一个来之不易的教训。
即使是国际象棋计算机,尽管该游戏完全由正式规则定义,但取得的成功也有些有限。当深蓝最终战胜长期的世界冠军卡斯帕罗夫时,这并不是基于对走法的更深入分析,而是基于输入机器的现有游戏的大型数据库。试图掌握语言,如生成翻译,被证明是一个难以解决的难题,主要是因为语言的使用一直逃脱了完全形式化的语法。简而言之,乐观情绪逆转,导致了 20 世纪 80 年代的“人工智能寒冬”。实际上,可以辨别出第一个(20 世纪 70 年代末)和第二个人工智能寒冬(20 世纪 80 年代末至 90 年代初);关于这方面的通俗易懂的叙述,请参见克里维尔(1993)或维基百科上的“人工智能历史”条目。
人工智能领域重新定位了自己。20 世纪 90 年代的一个主要趋势是将在世界上的行动作为表征智能行为的主要标准——比如取一杯咖啡而不洒出来,而不是下国际象棋。这种机器人转向产生了关于智能特征的新解释,与人工智能是什么——或者应该成为什么的新愿景相关联,参见菲弗和舍尔(2001)或布鲁克斯(2002)等。
然而,虽然机器人转向对人工智能来说只是一个适度的利基市场,但最近的炒作更加广泛,被称为人工智能的第二波浪潮,已经兴起了十多年。第一波符号人工智能以符号规则为导向——哲学家豪格兰德(1985)将这种方法标记为“好的老式人工智能”——GOFAI。基于这个术语,史密斯(2019)对第一波(GOFAI)和第二波(连接主义、神经网络)人工智能进行了深思熟虑的区分。与逻辑符号立场不同,几乎与之矛盾的是,当前的第二波是由统计方法推动的,以深度神经网络为范例。现在,关于规则的知识不再被视为至关重要。相反,这些知识的差距,甚至是巨大的差距,由对大量数据集的统计分析来弥补。简而言之,可以将人工智能的第二波与数据转向联系起来。
一系列流行和惊人的成功故事支持了第二波。很可能,每个读者都知道机器学习如何轻松地从国际象棋转向围棋(展示了神经网络的力量)。图像分类引起了轰动,最近,大型语言模型(LLMs)在翻译文本方面表现出的熟练程度是人工智能和语言专家都没有预料到的。此外,像 ChatGPT(由美国公司 OpenAI 开发)这样的 LLMs 或其他生成网络甚至增加了狂热度,因为许多人发现了一种生成文本的机器的用途,而且,此外,所有互联网用户都可以轻松使用这些机器的接口(这并不意味着它们是免费的)。
所有这些例子的共同点是,规则(对于分类、对于语言)不是明确建模的,而是隐式定义的。使一只鸟看起来像画眉鸟的是标记为画眉鸟的图像所共有的东西——与标记不同的图像(非画眉鸟)所“共有”的东西相反。语言也是如此。语法规则在很大程度上被跳过了。相反,机器生成的句子与数据库中的句子相似(当然,相似性的概念远非微不足道)。人类翻译会以非常不同的方式进行,或者更准确地说,会以非常不同的方式描述他们所做的事情:翻译单词、了解语法、考虑措辞等。机器学习方法只是假设现有的翻译以某种方式包含了所有这些知识。
简而言之,机器学习使对大型数据集的统计评估变得可行,并且如果有足够的数据,机器学习会得出令人惊讶的好结果。最近使用像 ChatGPT 这样的 LLMs 的经验证明了这一点。那么,普遍的关键是来自感兴趣领域的数据,而不是在拥有该领域发生的事情的良好模型意义上的知识。
但是等一下。AI(使用深度神经网络)的普遍性源于这些网络的灵活性。从数学上讲,对于这些网络来说,学习意味着调整一个匹配输入 - 输出行为的函数。使用像 LLMs 所使用的昂贵计算设备,实际上数十亿个参数被调整。为了以有意义的方式做到这一点,需要极大量的数据,例如 ImageNet 上的 1400 万张手工注释图像,或 OpenAI 编译的大量文本库(以完全非开放的方式)。因此,AI 中的数据转向不仅揭示了数据中包含的丰富隐性知识,同时,数据也呈现出一个新的瓶颈。
数据的可用性和质量取代了关于规则的知识,成为瓶颈。问题是,哪些领域有足够的数据可用?没有关于需要多少数据的正式规则。乐观情绪盛行,谈论“令人兴奋的可能性”已成为许多出版物的热门话题(例如,参见托尔格勒,2020)。然而,要区分热情的承诺和科学成就并不容易。例如,珀尔指出,在实际实践中,几乎从未有足够的数据可用(珀尔,2009,33)。
就数据是关键(而不是复杂的理论)而言,并且通过软件包可以访问分析工具,AI 运动对科学和商业都具有吸引力。体育科学就是一个很好的例子。例如,丁多夫等人(2023)警告说,科学研究应该抓紧时间,以免落后于商业应用。人们普遍认为,体育科学中的 AI 至少与(科学)建模一样受到商业应用的驱动。像赫迈特和韦斯特贝克(2021)的概述以《点球成金》(刘易斯,2003)为体育科学中 AI 的起点,因为它提供了一个关于如何创建数据并(商业地)使用它们的引人注目的、有影响力的例子。
下面的文本有三个部分:
第 1.2 节将 AI 置于数字化的背景下,并置于更广泛的数学化历史中。它从伽利略著名的自然之书的裁决开始,并认为机器学习标志着数学化的深刻转变。
第 1.3 节集中在认识论上,并认为认知不透明性是数字化的一个重要组成部分,更是 AI 的一个重要组成部分。这使得预测成为科学成功的一个更重要的标准,而解释能力则严重减弱。
最后第 1.4 节探讨了软件的使用如何导致科学的新社会组织形式。
1.2 数学化 - 数字化 - 人工智能
首先关于术语的一段话。
术语由于不同传统的重叠而变得复杂。AI 处理的任务如果由人类完成将被视为基于智能的任务,如下国际象棋、找到回家的路、识别面孔或写一篇文章。如引言中所述,AI 始于操纵逻辑规则。最近 AI 的成功主要来自深度学习,即使用多层人工神经网络(ANNs)。同时,ML 通常不仅包括这些方法,还包括随机森林等。因此,AI 和 ML 有时都声称拥有深度神经网络。在下面的内容中,我们忽略这些复杂性,并假设 AI 指的是一组通常涉及使用多层 ANNs 的方法。
这些网络可以根据其参数的设置展示出极其多样化的输入 - 输出行为。从数学上讲,这样的网络通过许多可调整的参数来近似一个未知的函数——想想图像分类,它是从图像集到标签集的映射。例如,当前的 LLMs 使用数十亿个这样的参数。它们是真正的近似巨兽,据说能够“学习”,因为参数调整是一个由一组训练数据引导的过程。近似机制迭代地找到越来越匹配这些数据的参数设置,从这个意义上说,模型从数据中学习。
一个非常重要的观察结果是,AI 不仅仅有助于解决问题,而且还影响问题的表述方式。仅仅部署计算机来解决现有问题将会失败,因为问题通常不是以适合计算机解决的正确形式出现的。因此,使用 AI 的意图会影响研究人员如何感知和表述问题。研究人员旨在以一种使问题适合 AI 解决的方式来提出问题。
这一点并非 AI 所独有,而是适用于一般使用计算机方法的情况。事实上,它超越了计算机,适用于所有类型的仪器。它一直是科学活动的一部分,或者更好——甚至更普遍——是人类行为的一部分。他们使用工具,这些工具塑造了他们看待世界和识别可解决问题的方式。一句来源不明的谚语抓住了这一点:“如果你唯一的工具是锤子,那么你很容易把所有东西都当作钉子来对待。”(维基百科上的“工具定律”条目提供了关于这句谚语可能来源的简要选择。)计算机,最近的深度学习,是科学仪器,以一种特别强大的方式发挥这种影响。
如果从研究对象所使用的仪器中辨别出世界上的对象,那么 AI 的情况至少包括两层。计算机是发现数学或形式结构行为的工具。但同时,也可以将数学结构视为发现世界上物体行为的工具。因此,存在两层,或两个嵌入——AI 作为数字化的一部分,数字化作为数学化的一部分。
关于数学化推理的一个最著名的起点是伽利略的裁决,即自然之书是用数学符号写成的。从 17 世纪开始,现代科学朝着数学化的方向发展,即从数学角度构想自然(马奥尼,1998)。伽利略的观点基于这样的形而上学假设,即世界就是它本来的样子,并且可以借助数学方法(也许没有其他方法)发现一些事实。重要的是,世界就像一本书,关于自然的一切都写在那里。这意味着,科学家是在解读这本书,而不是在写它。由于数学知识是最确定的知识,数学化的巨大希望是确定性和真理携手并进。
这个承诺从一开始就很大胆,因为它更多地基于哲学信仰而不是实际力量。数学方法需要一个正式的框架,通常涉及高度理想化的建模假设,而在实际应用中,许多因素相互作用。诚然,有一些理想化的例子是有效的,首先是天文学和行星的运动。牛顿的成就也许创造了科学史上最伟大的成功故事,当时他展示了力学定律、引力定律和一种新的数学方法(微积分)如何能够完全符合观测数据地推导出行星的椭圆轨道。从那时起,数学化深深扎根于科学的发展中。直到今天,数学方法仍然被视为某物是否科学的关键指标。自 17 世纪以来,发生了很多变化。一个最明显的点是计算机重新定义了数学工具的库。
让我们专注于模拟作为计算机仪器的一个主要领域。基本上,我们遵循伦哈德(2019)的主要论点,即“计算机和模拟建模确实形成了一种新型的数学建模”。(2)模拟建模的四个特征共同使其成为一种新颖的类型,即一种探索性和迭代性的建模类型。
实验。模拟实验构建了一类特殊的实验。通常,实验被描述为从自然中寻求答案。尽管实验提出的问题可能需要广泛的理论设计,就像日内瓦湖下充满高科技设备的巨大隧道(欧洲核子研究中心)一样,但在某种重要意义上,实验不是由理论决定的,即使它们是理论负载的。在这个例子中:欧洲核子研究中心的粒子对撞机是否记录到希格斯粒子的痕迹?模拟实验是不同的,因为它们评估已经做出的假设(和实现)所导致的模型行为。在某种程度上,它们质疑模型加计算部分,而不是自然。尽管它们与普通实验不同,但这些计算机实验仍然应该被视为实验,因为它们通过观察一个设计的开放式过程来寻求问题的答案。例如,运行一个天气模型十次,并计算在凯泽斯劳滕下雨的次数,以这种方式确定所谓的降雨概率。
实验的探索性变体对模拟建模特别相关。这里的重点是构建模型的过程。通常,模型不仅是由一些理论考虑驱动的,而且是由它的行为驱动的。深度学习是一个很好的例子。ANN 由参数调整控制,但这些参数的值通常没有意义。它们的值不能从理论考虑中确定。它们在反复实验的过程中进行调整,以探索模型行为。“模型假设的效果很难甚至不可能进行调查,可以通过应用迭代实验程序进行测试、变化和修改。建模和实验同意进行探索性合作。这种合作经常使用人工元素”(伦哈德,2019,133)。
人工元素。深度学习中的参数化是一个主要例子,但人工元素对几乎所有计算方法都很重要。让我用一个例子代替完整的论证。如果一个模型用连续数学的语言表达,在计算机能够评估它之前,它必须被离散化。有各种离散化的方法,都需要设计成使得离散模型的动态与原始连续模型的动态紧密匹配。“当控制离散模型的性能时(即出于工具主义——尽管不可避免——的原因),包括人工组件。实验是必要的,以适应模拟模型的动态,因为如果没有这样的实验循环,就无法判断这些人工元素是否足够。这赋予模拟建模一个工具主义方面,模糊了表示关系,从而削弱了解释力”(同上,133)。
可塑性。“这表示模拟模型动态的高度适应性。这样一个模型的结构核心通常只不过是一个模式,在模拟特定模式和现象之前,需要——并且允许——进一步的规范。”(同上,134)。再次,深度学习是一个主要例子。神经网络通常几乎是完全通用的。它是否可以用于图像分类或语言生成,基本上取决于数据和学习过程中的参数分配,即迭代探索性实验。结构和规范都是确定模型动态特性所必需的。
认知不透明性。“这是因为模型在几个方面变得更加复杂。动态事件的过程包含大量的步骤,因此整体结果无法从结构中推导出来。相反,它来自模型假设和运行时选择的参数分配。此外,动态的重要属性来自模型开发过程中所做的规范和调整。这与传统的数学建模概念及其对认知透明度的关注相比,揭示了一个根本的区别。”(同上,134)。期望是,形式建模使模型中发生的事情以及因为模型是关于世界的,所以世界中发生的事情变得可理解。本质上,这是阅读自然之书的承诺。对于模拟建模,更普遍地对于基于计算机的建模,模型的基本特征是其灵活性。新的承诺是,通过适当的适应机制,模型可以被调整以匹配观察到的数据和现象。而正是适应机制造成了不透明性。
这些特征不是相互独立的,而是相互支持和加强的。因此,它们不仅仅是一组特征,而是形成了一种独特的类型。模拟建模是以探索性和迭代性的方式进行的,在这个过程中,部分使用并部分补偿了上述提到的组件(不透明性)。
计算仪器和建模的概念相互影响。一个方向似乎很明显。数学模型以各种方式支持计算机的设计和开发。但另一个方向至少同样重要:通过使用计算机作为工具,数学建模被引导。首先,这种引导代表了一种认识论的转变。传统上,数学建模是由人类主体积极建模以获得洞察力、控制或其他任何东西。引导效应的产生是因为添加了一个额外的技术层面:建模必须找到一种平衡,即补偿由于使用计算机而导致的那些(额外)转换——也就是说,通常要通过模型内的进一步附加结构在一定程度上中和它们。
深度学习中使用的 ANNs 在整个分析中一直作为例子。伦哈德(2019)在同一框架中讨论了更多和不同的例子。ANNs 的典型特征是什么?它们是一种特殊类型的模型,因为它们的构建几乎独立于它们应该捕获的现象类型。它们具有非常通用的模型结构。一个简单的观察是,这些网络经常被展示,但所有图片看起来基本上都相同。事实上,结构并不代表目标现象。因此,可以称 ANNs 在结构上是不确定的。同时,它们包含极大量的参数,其调整使整体行为如此多样化,以至于它可以近似于几乎任意的函数。换句话说,模型行为完全取决于参数的规范(调整)。这与传统的模型构建理念形成了强烈对比,在传统理念中,结构应该捕获现象,而参数用于微调。
从形式和抽象的角度来看,迭代是与 ANNs 相关的典型动作。它们的构建通常是没有意义的,在某种意义上,构建中的元素在目标域中没有解释——没有必要为了构建后来通过与自己反复玩游戏而可靠地击败世界冠军的网络而需要一位围棋冠军。参数调整更加重要。这是迭代发生的,即在每个学习步骤中每个参数都被调整——并且学习步骤本身也是迭代的。从硬件的角度来看,这样的过程需要执行大量简单的迭代。
最后,ANNs 代表了数学化的一个转变。现在,数学化不是关于自然之书。它不是代表世界的工具。相反,数学被用作构建和控制 ANNs 所是的巨大近似机器的工具。约斯特(2017)认为,现在的数学化关注的是工具的数学化。这样一种内向的转变如何能导致在图像分类或语言生成等现实世界任务中取得成功的东西呢?
基本上,这些成功是基于一种基本的工具主义方法,即对模式的统计处理——不管这些模式意味着什么。
1.3 认识论:不透明性与理解
黑箱建模仅处理输入 - 输出行为,而其对应物,白箱建模,则关注模型的内部运作。显然,黑箱模型无法解释建模系统为何如此行为。因此,用白箱、透明模型取代具有黑箱特征的不透明模型是一个普遍的目标。一个很好的例子是珀尔(1997),他诊断出建模的目标是越来越复杂的系统,而这种复杂性禁止了白箱模型可能的分析。珀尔表达了希望,像神经网络这样的方法可能会为理解复杂系统开辟一条新途径(珀尔,1997,302)。
大约 25 年前,人们普遍认为新的计算方法可能会带来理解复杂系统的新方法。然而,ANNs 的快速发展带来了预测成功,但同时也带来了完全不透明的模型。人们仍然可以坚持使这些模型透明到一定程度的目标,以便能够解释它们的预测。毫不奇怪,并且响应于 ANNs 的成功,最近有呼吁发展“可解释的 AI”(XAI)。然而,不透明性是一般模拟(汉弗莱斯,2004;伦哈德,2019),特别是深度学习的一个重要组成部分——正如上面所论证的。到目前为止,XAI 仍然是一个开放的研究领域,其成功(或失败)只能在未来判断。
如果人们接受不透明性是使用 AI 的一个不希望但不可避免的条件,那么 AI(以及更普遍的数字化)的承诺会是什么样子?从历史和哲学的角度来看,预测挑战了对解释的追求。这种紧张关系一直是整个关于解释的讨论的伴随物,自现代性开始以来——实际上甚至更长时间:自从数学在认识论和实践的考虑中发挥任何作用以来。一个基本的观点是,预测的能力表明了一些重要的事情。在某种程度上,无论能够给出良好预测的东西,都对世界或正在调查的世界的一部分有正确的认识。而这个东西是预测能力的基础和真正来源。
值得注意的是,新方法似乎颠覆了这一点:预测是基于一种方法或一种通用模型进行的,其代表性属性是有问题的,甚至是不可访问的。理解仍然可能吗?理解是认识论中一个核心但有些模糊和多方面的概念。几十年前,理解有时被认为是解释的反义词。科学哲学中有大量关于解释的文献,而关于理解的文献则少得多。像德雷格特等人(2009)的书表明了一种变化——理解现在在科学哲学的议程上。
在某种程度上,模拟模型可以在一定标准上提供理解。科学家可能会进行迭代模拟实验并创建可视化,以这种方式了解输入 - 输出动态的样子。在这样做的过程中,他们可以在模型中定位自己——即使动态的部分对他们来说是不透明的。当然,这种对模型的熟悉程度不符合通常对数学模型提出的高认知要求(参见罗素(1905)的熟人知识概念)。然而,如果目标是受控干预,那么这种较低的标准仍然足够。换句话说,模拟模型可能在认知上仍然不透明,但仍然提供了控制动态的手段。
一个典型的例子是经向翻转环流(MOC),即墨西哥湾流可能的崩溃。研究人员研究 MOC 在不同条件下(在模拟模型中)的行为,如温度升高。他们的目标是了解它的稳健性。但这里的理解与费曼的情况相反。他想在不计算的情况下了解行为,而了解 MOC 的情况是基于大量的计算。同样,结构工程随着计算建模而改变了它的面貌。可以欣赏到大胆的建筑,如果没有通过计算机模型计算其结构稳定性,就不可能规划这些建筑。工程师理解这些建筑的行为,但在非常务实的意义上,这不预设认知透明度。
当然,人们可能会质疑务实的概念是否应该被称为理解。因此,我们面临两个选择:第一,模拟是否在科学和工程实践中消除了理解?或者第二,模拟实践是否用一个较弱的、务实的理解概念取代了强烈的理解概念?如果人们接受模拟模型的复杂性使得认知不透明性不可避免,而同时,这些模型仍然对干预和预测有益,那么问题是:这种共存是否会导致科学理解的新概念或重新定义?设计一个答案来回答这个问题仍然是科学哲学的任务。
因此,论证导致了一个双重主张。第一,模拟可以促进对模型行为的熟悉和定位,即使模型动态本身仍然(部分)不透明。第二,模拟以一种重要的方式改变了数学建模:基于理论的理解和认知透明度退居幕后,而一种面向干预和预测而不是理论解释的务实理解浮出水面。
1.4 软件以及专业知识是如何组织的
如果研究人员想要使用模拟或其他计算方法,特别是 ML,他们必须拥有适当的基础设施。每个人都会立即想到计算机终端,这是正确的。然而,在这种情况下,基础设施要广泛得多。作为一个概念,基础设施非常有趣,因为它能捕获,或允许捕获,现代社会、技术和监管是如何相互关联的,见爱德华兹(2002)。拥有它是要求很高的,就昂贵的技术而言,实际上使用它也要求很高,就应该以何种方式提出何种问题而言。(作者Max:ML指的是Machine Learning机器学习)
这些基础设施元素之一是数据。ANNs 在统计上识别相关性时发挥其优势。突出的成功有双重根源。首先,ANNs 可以处理不久前被认为不可行的数据量。这种数据消化能力依赖于硬件(如使用图形处理单元)和软件的联合成就。其次,ANNs 对相关性微妙痕迹的敏感性只有在有真正大量数据可用时才有用。否则,所有的参数和优化程序都将闲置,或者更糟糕的是,导致虚假信号。这使得 ANNs 渴望数据。因此,研究人员强烈动机提出关于有大量数据可用或可以生成的领域的问题。在一个恰当的分析中,珀尔(2009)指出,体育科学中的 ANN 方法遭受这样的事实,即它们需要的数据比可用的数据更多。对于计算机方法将导致以数据为中心的第四范式科学的陈述,见海伊等人(2009)。这本书来自微软,一家参与数据业务的大公司,这肯定不是巧合。
第二个元素是整个研究工作流程的网络特征。来自互联网的综合图像库存等数据通常不会本地存储。可以说,谷歌或其他公司建立了巨大的计算中心,复制并存储整个互联网。但这只会加强这种情况,因为普通研究人员必须连接到这些数据存储。此外,实际计算的部分通常也外包。当学习和调整参数时,研究人员通常使用像 TensorFlow(阿巴迪等人,2015)这样的软件套件,它在谷歌维护的平台上运行。因此,建模的探索性 - 迭代模式——在迭代学习步骤中指定参数——已被一种新的网络和集中式基础设施所采用。尽管它是集中式的,但它随时可用(或者某些公司认为符合其利益的部分是可用的)。此外,探索性部分是自动化的;它包括几乎完全独立于建模者调整参数,从而有助于不透明性。
软件应该与计算作为基础设施的第三个元素区分开来。传统上,创建充分操作研究问题的软件是科学专业知识的关键组成部分。在 20 世纪 80 年代和 90 年代,座右铭是计算专业知识应该成为特定领域的一部分,如体育科学,因为软件开发人员和用户之间的分工将不再起作用(拉梅斯等人,1997,第 30 页)。从某种意义上说,这个座右铭已经实现了。今天,每个人都在使用计算机。然而,在一个重要的意义上,发生了非常不同的事情。软件包变得可用,这使得许多用户可以轻松地进行计算科学,或者至少是可行的,而无需成为实际开发软件的专家。这种劳动分工的转变相当于专业知识在社会组织方式上的根本转变。例如,约翰逊和伦哈德在(2024)的第4章中描述了量子化学模拟是如何被研究人员使用的,这些研究人员是此类软件的专家,但不是量子化学理论的专家。软件及其使用方式的组织是历史、社会学和科学哲学共同的新研究课题,例如见海格(2013)、霍克特和维伯(2021)、约翰逊和伦哈德(2024)。
在人工智能中,社会组织的一个高度可见的特征是,有许多竞赛被设立,以最好的程度或最低的失败率来完成给定的预测任务(如在 Kaggle 平台上)。这些竞赛吸引了来自不同群体的关注,并建立了一个独立于学术界的舞台(尽管典型的参与者与大学有过接触)。当数据和软件在互联网上提供时,参与者可以独立于大学或其他学术机构提供的资源行事。这些竞赛作为一个市场,大公司从这里招聘科学家和程序员。
重要的是,当涉及到政策和监管时,方法和基础设施共同创造了一种新的情况。预测的质量取决于(训练)数据的质量。由于数据的质量(仍然)定义不明确,主要参与者将数据的数量作为代理。今天,特斯拉在开发其自动驾驶汽车时收集的数据等被视为商业宝藏(更不用说 Facebook 和该领域的其他参与者了)。而收集的数据是专有的,政府干预,如规定汽车何时必须刹车,取决于对这些数据的访问。因此,就监管措施或更好的说法,就其合理性而言,实践正走向冲突。
最后,关于本章开头提出的观点的一个简短总结:如果一个领域正在进入人工智能,这可能会产生什么潜在影响?总的来说,数字化带来了新的研究工具。其广泛分布和采用取决于一个全面的基础设施,该基础设施使软件的使用对非专家也成为可能,并将新的研究导向适合这些新工具的领域和问题。具体来说,由于数据是一个潜在的瓶颈,研究人员需要创造力来解决他们有足够数据或可以生成足够数据的问题。从哲学上讲,模拟和人工智能方法带来了认知不透明性。它们产生预测,但在解释方面往往不太有希望。
参考文献:
1. Abadi, M, Agarwal, A., Barham, P., Brevdo, E., Chen, Z., Citro, C., Corrado, G.S., Davis, A., Dean, J., Devin, M., Ghemawat, S., Goodfellow, I., Harp, A., Irving, G., Isard, M., Jozefowicz, R., Jia, Y., Kaiser, L., Kudlur, M., Levenberg, J., … Zheng, X. (2015). TensorFlow: Large-scale machine learning on heterogeneous systems. Software available from tensorflow.org
2. Bartlett, R. (2006). Artificial intelligence in sports biomechanics: New dawn or false hope? Journal of Sports Science & Medicine, 5(4), 474–479.
3. Brooks, R. A. (2002). Flesh and machines: How robots will change us. Pantheon Books.
4. Chmait, N., & Westerbeek, H. (2021). Artificial intelligence and machine learning in sport research: An introduction for non-data scientists. Frontiers in Sports and Active Living, 3. https://doi.org/ 10.3389/fspor.2021.682287
5. Crevier, D. (1993). AI: The tumultuous history of the search for artificial intelligence. Basic Books.
6. de Regt, H., Leonelli, S., & Eigner, K. (2009). Scientific understanding. University of Pittsburgh Press.
7. Dindorf, C., Bartaguiz, E., Gassmann, F., & Fröhlich, M. (2023). Künstliche Intelligenz in Sport und Sportwissenschaft. Potenziale, Herausforderungen und Limitationen. Springer Spektrum.
8. Edwards, P. N. (2002). Infrastructure and modernity: Force, time, and social organization in the history of sociotechnical systems. In T. J. Misa, P. Brey, & A. Feenberg (Eds.), Modernity and technology (pp. 185–226). The MIT Press. https://doi.org/10.7551/mitpress/4729.003.0011
9. Haigh, T. (2013). Software and souls; programs and packages. Communications of the ACM, 56(9), 31–34. https://doi.org/10.1145/2500131
10. Haugeland, J. (1985). Artificial intelligence: The very idea. The MIT Press.
11. Hey, T., Tansley, S., Tolle, K., & Gray, J. (2009). The fourth paradigm: Data-intensive scientific discovery. Microsoft Research. https://www.microsoft.com/en-us/research/publication/fourthparadigm-data-intensive-scientific-discovery/
12. Hocquet, A., & Wieber, F. (2021). Epistemic issues in computational reproducibility: Software as the elephant in the room. European Journal for Philosophy of Science, 11(2). https://doi.org/10. 1007/s13194-021-00362-9
13. Humphreys, P. (2004). Extending ourselves. Computational science, empiricism, and scientific method. Oxford University Press.
14. Johnson, A., & Lenhard, J. (2024). Cultures of prediction. The MIT Press.
15. Jost, J. (2017). Object oriented models versus data analysis-Is this the right alternative? In J. Lenhard & M. Carrier (Eds.), Mathematics as a tool (Vol. 327, pp. 253–286). Springer International Publishing. https://doi.org/10.1007/978-3-319-54469-4_14
16. Lames, M., Miethling, W.-D., & Perl, J. (1997). Interessenlagen und Perspektiven. In J. Perl, M. Lames, & W.-D. Miethling, Informatik im Sport: Ein Handbuch (pp. 27–30). Hofmann.
17. Lenhard, J. (2014). Disciplines, models, and computers: The path to computational quantum chemistry. Studies in History and Philosophy of Science Part A, 48, 89–96.
18. Lenhard, J. (2019). Calculated surprises. Oxford University Press.
19. Lewis, M. (2003). Moneyball: The art of winning an unfair game. W. W. Norton & Company.
20. Mahoney, M. S. (1998). The mathematical realm of nature. In D. Garber & M. Ayers (Eds.), The Cambridge history of seventeenth century philosophy (pp. 702–755). Cambridge University Press.
21. McCarthy, J. (1988). Review of the question of artificial intelligence. Annals of the History of Computing, 10(3), 224–229.
22. Perl, J. (1997). Ausblick. In J. Perl, M. Lames, & W.-D. Miethling, Informatik im Sport. Ein Handbuch (pp. 299–303). Hofmann.
23. Perl, J. (2009). Musteranalyse im Sportspiel mit Hilfe Neuronaler Netze. In J. Perl, M. Lames, C. Augste, O. Cordes, C. Dreckmann, C. Görsdorf & M. Siegle (Eds.), Gegenstand und Anwendungsfelder der Sportinformatik (Vol. 189, pp. 33–40). Czwalina Verlag.
24. Pfeifer, R., & Scheier, C. (2001). Understanding intelligence. The MIT Press.
25. Russell, B. (1905). On Denoting. Mind, XIV(4), 479–493. https://doi.org/10.1093/mind/XIV.4.479
26. Smith, B. C. (2019). The promise of artificial intelligence. The MIT Press.
27. Torgler, B. (2020). Big data, artificial intelligence, and quantum computing in sports. In S. L. Schmidt (Ed.), 21st century sports: How technologies will change sports in the digital age (pp. 153–173). Springer. https://doi.org/10.1007/978-3-030-50801-2
作者介绍:郭佰鑫(Max)
作者Max,一位大三的本科生,社交自媒体平台专注于输出体育科技以及体育科学相关内容,期待未来有能力的基础下能加入更多基于人工智能的体育分析与科技。有其他科研合作的欢迎您的联系
▼ 麻烦您带一下备注!