积少成多,从量变到质变,改良也是一种进步 - 开源热榜20241022
💎 今日感慨: 虽说现在的AI大模型还有着效率、幻觉、上下文长度等不少硬伤,但通过全球技术人不懈的努力与合作,这些障碍正在逐步消除。放在3年前,谁也不会想到,今天的AI能发展得这么快,又这么好👍。想起朋友 xifan 之前说过的:改良也是一种进步。的确,积少成多,从量变到质变,相信我们终将越来越好。
📌注: 所有项目均来自全球最大的开源网站,仓库名称前加 https://github.com/
即是完整网址。欢迎关注,从更多新奇的角度来解读开源项目。
仓库:phidatahq/phidata
🌟点评: Phidata 是一个用于构建具有记忆、知识、工具和推理能力的智能代理题的框架。你可以用它来构建、运行、监控和优化你的智能体。Phidata 不存储任何数据,所有代理数据都存储在本地的 SQLite 数据库中。
Phidata 框架的亮点在于其对智能代理的全面支持,从构建到运行再到监控,提供了一站式的解决方案。此外,通过提供用户界面和内置工具,使得非技术用户也能轻松地与智能代理进行交互。这个项目可以让开发者能够专注于创意和业务逻辑,而非底层的技术细节。
🔧 功能特点
构建智能代理:可以构建具有记忆、知识、工具和推理能力的智能代理。 软件应用运行:可以将代理作为软件应用程序运行,包括数据库、向量数据库和 API。 监控与优化:可以监控、评估和优化你的代理系统。 多代理协作:支持构建代理团队,协同工作。 推理代理:代理可以通过逐步推理解决问题,支持回溯和修正。 RAG 代理:能够搜索知识库,找到完成任务所需的具体信息。 代理 UI:提供用户界面与代理交互。 内置监控与调试:提供了内置的监控和调试工具。
仓库:yt-dlp/yt-dlp
🌟点评: 之前介绍过,yt-dlp 是一个功能丰富的命令行音视频下载工具,支持从成千上万的网站(包括国内的一些著名站点)下载内容。这个项目是 youtube-dl 的一个分支,基于不再活跃的 youtube-dlc。作为一个命令行工具,甚至还支持插件(提取器、后置处理等)!不过使用时一定要注意合法性和下载内容的版权问题。
📄 许可证
该项目采用的许可证较少见,叫 Unlicense
,望文生义就是“没有许可”,这是一种公共领域奉献许可证,意味着项目 完全自由地 供公众使用。Unlicense
实际上是一种公共领域的声明,而不是传统意义上的开源许可协议(如 GPL 或 MIT等)。这意味着代码没有版权保护,任何人都可以随意使用该代码, 没有任何限制 ,当然也可以用在商业上。尽管它不像其他开源许可证那样有明确的法律文档支持,但它确实包含了一些法律声明,以确保使用者不会因为使用代码而受到法律诉讼。应用场景如个人项目、教学项目等。具体可见:http://unlicense.org/。
🔧 功能特点
支持从多个网站下载视频和音频。 可以合并音频和视频流到一个文件。 支持多种格式和质量的选择。 可以提取和下载字幕。 支持断点续传。 可以从浏览器自动获取 cookies。 支持多种命令行选项和配置文件。
⚠️ 注意事项
依赖 Python 3.8 或更高版本;某些功能依赖 ffmpeg 等第三方包。
仓库:CleverRaven/Cataclysm-DDA
🌟点评: Cataclysm: Dark Days Ahead是一个末日生存题材的回合制游戏。玩家在一个由程序生成的严酷世界中搜寻资源、装备和交通工具,与各种怪物和其他幸存者战斗。游戏由超过1000名志愿者贡献,主要编程语言为C++,跨Android、Linux、OSX、Windows等多个平台,代码和内容在CC BY-SA 3.0许可下自由使用和修改。
仓库:bluesky-social/social-app
🌟点评: Bluesky是一款基于去中心化社交媒体AT协议开发的社交网络平台,旨在提供更开放、透明和用户自主的社交网络体验,由Twitter前CEO杰克·多西支持创建。项目采用MIT许可,主要用React Native框架和TypeScript编程语言开发,同时包含少量Go语言编写的代码,用于支持网络服务。用户可以通过Web、iOS和Android平台获取应用。
项目的一大特色在于:它基于AT协议,AT协议(Authenticated Transport Protocol
)是一种新的网络通信协议,旨在通过去中心化的方式改进现有的社交媒体平台,使其更开放、透明和用户可控。支持用户自定义内容呈现算法。
🔧 主要特点
账户可移植性:用户可以自由地将他们的账户和数据迁移到不同的服务提供商,而不受单一平台的束缚。 算法选择:允许用户根据自己的偏好选择推荐算法,增强用户体验的个性化。 互操作性:不同服务之间能够无缝连接和交互,提高系统的灵活性和扩展性。 性能:设计上注重高效的数据传输和处理能力,确保良好的用户体验。
仓库:solana-developers/program-examples
🌟点评: 区块链相关。这个仓库是索拉纳(Solana)链上程序(在其他区块链中通常称为“智能合约”)的示例集合。这些示例覆盖了不同编程语言和框架,以帮助开发者学习和实践。
仓库:TheAlgorithms/Python
🌟点评: 这是个经常上榜的开源项目,用Python语言实现各种算法,用于学习和教育用途。项目的算法实现可能不如CPython标准库中的实现高效,但它们为理解算法的各种原理提供了更大的便利。
该作者还提供其它一些编程语言的算法实现,除了Python,其它最热门的不外乎这几个:Go、Java、JavaScript、Rust,由此也可见这几种编程语言的热火程度😄。
仓库:DrKLO/Telegram
🌟点评: Telegram是一个注重速度和安全的即时通讯应用。非常快速、简单且免费。这是 Telegram 的官方安卓版源码。
⚠️ 注意事项
源码仅供学习研究,使用App前请必须注意合法性。
仓库:norvig/pytudes
🌟点评: 这个名为 pytudes
的项目是一系列 Python 编程练习,由著名的计算机科学家 Peter Norvig 自2015发起,一直维护至今。项目采用 MIT 授权。这些练习旨在帮助程序员们磨练和完善特定的编程技能,就像练习曲(法语 étude,指学习等)帮助音乐家提高技艺一样。这些 Python 程序虽然不大,但难度却相当大,包括用 Python 写的 Lisp 语言的解释器等,需要具备相当的计算机基础,可以用来帮助提升计算机技能。
🔧 功能特点
Jupyter Notebooks:项目包含多个 Jupyter Notebooks,涵盖了从逻辑谜题到计算机科学算法的广泛主题。代码结合文档,方便学习。 多样化的主题:包括但不限于概率论、逻辑谜题、字谜、计算机科学算法等。 互动性:通过链接到 Colab、Deepnote、Mybinder 等平台,可以直接运行和修改 Notebooks,增加了学习的互动性。 持续更新:项目持续更新,包含最新的编程挑战和解决方案。
仓库:EricLBuehler/mistral.rs
🌟点评: Mistral.rs 是一个为大规模语言模型(LLM)提供 超快速推理 能力的库。它支持多种开源模型(Llama 3.2 Vision、AnyMoE、带128K上下文的Phi 3.5 MoE/3.5/3.1/3、FLUX.1等),包括文本到文本、文本+图像到文本和文本到图像。项目提供了Python和Rust的API,以及与OpenAI API兼容的HTTP服务器。项目主要用 Rust 语言编写,基于 MIT 许可。
Mistral.rs 通过提供对多种硬件加速器的支持,使得在不同的设备上都能实现高效的模型推理。此外,该项目的量化支持和模型适配器功能,使其在模型部署和优化方面具有很高的灵活性。对于需要处理大规模语言模型的开发者来说,Mistral.rs 是一个非常有价值的工具。
🔧 功能特点
易用性:提供了轻量级的OpenAI API兼容HTTP服务器、Python API、语法支持(Regex和Yacc)以及ISQ(In situ quantization)。 速度:支持苹果硅芯片(ARM NEON、Accelerate、Metal)、加速CPU推理(MKL、AVX支持)和CUDA支持(包括flash attention和cuDNN)。 量化:支持GGML、GPTQ和HQQ等多种量化技术。 功能强大:支持LoRA、X-LoRA、AnyMoE和多种采样/惩罚方法。 高级特性:包括PagedAttention、前缀缓存、拓扑配置和UQFF等。
仓库:facebookresearch/co-tracker
🌟点评: CoTracker 是Facebook研究中心开源的一个基于快速变换模型的开源视频点跟踪工具,它能够对视频中的任意像素点进行跟踪,并带来了光流跟踪的一些优点。它的口号是“CoTracker: It is Better to Track Together”(CoTracker:最好一起跟踪)反映了这个算法的理念,从下图也可以看出,很多运动图像中的像素,有着自然的关联性。
🔧 功能特点:
能够跟踪视频中的任意像素点 可以同时跟踪准密集的一组像素点 支持手动选择点或在视频帧的任何网格上采样点
📄 使用指南:
你可以通过 torch.hub
加载预训练模型来使用 CoTracker。提供了离线和在线两种模式,支持从视频流中进行实时跟踪。 通过可视化工具,可以观察到预测的跟踪结果。
仓库:godotengine/godot
🌟点评:经常上榜,之前也介绍过。Godot 引擎是一个功能丰富的跨平台游戏引擎,支持从统一界面创建2D和3D游戏。它提供了一套全面的常用工具,让开发者可以专注于游戏制作而无需重复造轮子。游戏可以一键导出到多个平台,包括主流桌面系统(Linux、macOS、Windows)、移动平台(Android、iOS)、Web平台以及主流的游戏主机。
Godot完全免费且开源,遵循非常宽松的MIT许可。它没有附加条件、版税或任何限制。Godot的开发完全独立且由社区驱动,使用户能够参与塑造符合他们期望的引擎。它由非营利的Godot基金会支持。在2014年2月开源之前,Godot由Juan Linietsky和Ariel Manzur(两位至今仍在维护项目)开发了数年,作为内部引擎,用于发布多个委托作品。
仓库:ranaroussi/yfinance
🌟点评: yfinance
是一个开源的Python库,它提供了一个多线程和Pythonic的方式从雅虎财经下载历史的市场数据。项目基于Apache许可。
这个工具非常适合研究和教育目的,是金融数据爱好者和研究人员的得力助手。项目的成功也反映了社区对于开放数据和开源工具的强烈需求。
🔧 功能特点
提供了一个 Ticker
模块,可以访问股票信息和历史市场数据。支持下载多个股票代码的数据。 提供了 Sector
和Industry
模块,可以访问美国市场的信息。包含 Screener
模块,可以根据指定的查询筛选市场。支持使用代理服务器下载数据。 使用 logging
模块处理消息,默认只打印错误信息。支持智能抓取,减少对Yahoo的请求压力。
⚠️ 注意事项
yfinance
不是由Yahoo官方支持或认可的,它是一个使用Yahoo公开API的开源工具。Yahoo Finance API仅供个人使用,请遵守Yahoo的使用条款。 使用 yfinance
时,合理控制请求频率,避免触发Yahoo的反爬虫机制,可以更好地保护和使用这一资源。
每当我写完一篇新文章时,也是我又学到一些新知识的时候。即使最终没有几个人看,对我而言,满足感也是满满的。
也恭喜你看完这篇文章,又学到了新的东西!加油💪,跟自己比,我们永远都有无尽的成长空间、无穷的满足感可以不断地追寻!