人工智能(Artificial Intelligence),英文缩写为AI。它是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人为(如学习、推理、思考、规划等)智能的理论、方法、技术及应用系统的一门新颖科学技术。
人工智能是智能学科重要的组成部分,它企图了解人为智能的实质,并生产出一种新的能以与人类智能相似的方式做出反应的智能机器。人工智能是十分广泛的科学,它包括机器人、语言识别、图像识别、自然语言处理、专家系统、机器学习,深度学习、计算机视觉、神经网络、生成式行为等。
人工智能是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能),也被认为是二十一世纪三大尖端技术(基因工程、纳米科技、人工智能)之一。这是因为近三十年来它获得了迅猛地发展,在很多学科领域都获得了广泛的应用,并取得了丰硕的成果。人工智能已逐步成为一个独立的分支,无论在理论和实践上都已自成一体,并继续向广度和深度延伸。
GPT是一种基于互联网可用数据来训练的文本生成式深度学习模型。GPT与专注于下围棋或机器翻译等某一个具体任务的“小模型”不同,AI大模型更像人类的大脑,它兼具“大规模”和“预训练”两种属性,可以在海量通用数据上进行预先训练,能大幅提升AI的泛化性、通用性和实用性。
2024年2月6日,美国专利商标局称,消费者不知道 GPT 的含义并不重要 —— 因为那些使用该技术的人了解 GPT 指的是一种通用类型的软件,而不仅仅是 OpenAI产品。
2024年2月17日,美国专利商标局拒绝了 OpenAI 将 GPT 一词注册为商标的申请,他们认为 GPT 的意思是生成式预训练转换器,它更像一个过于笼统的技术术语,可能会阻止竞争对手将其产品描述为 GPT。而OpenAI申诉称:GPT并不是一个描述性的词语,也不是一个通用的技术术语,消费者会“立即理解”它的名称意义。
OpenAI是一家创立于2015年12月,总部位于美国旧金山的开放人工智能研究和部署的公司,其使命是确保通用人工智能造福全人类。现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。
2016年,发布了一款开源强化学习工具包OpenAI Gym和Universe首个产品。目前微软拥有OpenAI 49%股份,OpenAI已跻身全球TOP50网站 ,位列福布斯《2023云计算100强榜单》榜首。
ChatGPT是Chat Generative Pre-trained Transformer的简称,是OpenAI研发的一款聊天机器人程序, 它于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,自主作出生成式回答,还能根据聊天的上下文关联进行互动,真正像人类一样来进行聊天交流,甚至能完成撰写文案、邮件、脚本、翻译、代码等任务。
生成式图像和视频技术是人工智能领域的一个热点研究方向,近年来取得了显著的进展。扩散模型(Diffusion Models)作为其中的关键技术之一,在图像生成、视频制作、音频合成等领域展现出强大的能力。它包括但不仅限:
扩散模型改进:为了提高高分辨率图像生成的效率,研究者提出了优化时间步长的策略,通过设计一个通用框架来提升图像的生成性能。
文本到图像生成:扩散模型也被用于文本到图像的生成任务,通过改进的文本编码器和将文本嵌入整合到扩散过程中的方法,提高了生成图像的质量和文本对齐。
视频生成技术:在视频生成领域,研究者探索了结合扩散模型和Transformer技术的方案,提出了统一的时空掩码建模机制,用于生成具有高质量一致性的视频。
随着AI技术的突飞猛进地发展,更多新的技术和应用将出现,它既给人们带来了许多新的福音,同时也会给人们造成一些困惑和疑虑,相信一切将会变得越来越好!
AI新知识正在不断更新和采集整理中。如果您在AI领域有什么新想法和认知,请告知我们,让我们一起为探索新知识,掌握新技术而同心协力,共同进步!