PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持
最近更新: 4个月前一个将 TensorFlow 框架移植到 .NET 平台的项目。它提供了用于构建和训练深度学习模型的强大功能和 API,并允许开发者在 .NET 应用程序中直接使用 TensorFlow 的功能。
最近更新: 4个月前DeepWiki-Open 是一个自动为 GitHub、GitLab 或 BitBucket 仓库生成交互式 Wiki 的工具。它通过分析代码结构、生成文档、创建可视化图表并整理成易导航的 Wiki,帮助开发者快速理解项目架构。
最近更新: 4个月前生产级多平台智能机器人开发平台. 提供 Agent、知识库编排、插件系统 / Bots for Discord / Slack / LINE / Telegram / WeChat(企业微信, 企微智能机器人, 公众号) / 飞书 / 钉钉 / QQ / Satori
最近更新: 4个月前一个开源的零代码智能体自动生成平台——无需编排、复杂的拖放操作,使用时 MCP、RAG 这些都不需要考虑。全程无需写代码,技术小白也可以轻松构建一个属于自己的智能体。不管是撰写深度研究报告、分析表格、设计海报...这些智能体都可以通过 Nexent 轻松配置。
最近更新: 4个月前这是一个基于混合专家(MoE)和多头潜在注意力(MLA)架构的开源大语言模型,在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数,但每个 token 只激活其中的 37B 参数。即在处理输入时,并非所有“专家”都参与计算,而是选择一部分专家进行处理。通过激活部分参数(37...
最近更新: 5个月前llm.c 是一个简单、纯粹的 C/CUDA LLM 训练项目。不需要使用 245MB 的 PyTorch 或 107MB 的 cPython 就能用纯 C 语言训练 LLM。 更让人佩服的是,LLM.c 仅用约 1000 行干净的代码即可在 CPU/fp32 上实现 GPT-2 训练。它可...
最近更新: 5个月前Qwen3-VL 是阿里云通义千问团队开发的多模态大语言模型系列。它在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力方面进行了全面升级。
最近更新: 5个月前nanochat 是训练 LLM 的最简单实验性工具。它设计为可在单个 GPU 节点上运行,代码简洁且易于修改,涵盖了 LLM 的所有主要阶段,包括分词、预训练、微调、评估、推理和聊天用户界面。
最近更新: 5个月前Tabby 是 GitHub Copilot 的本地开源替代品。它使用 StarCoder、DeepSeek Coder 或 Code Llama 等模型,为您常用的编辑器提供自动完成和内联建议功能。
最近更新: 5个月前将Claude Code转换为结构化开发平台:SuperClaude是一个元编程配置框架,通过行为指令注入和组件编排,将Claude Code转换为结构化开发平台。它提供系统化的工作流自动化,配备强大的工具和智能代理。
最近更新: 5个月前本项目为xiaozhi-esp32提供后端服务,帮助您快速搭建ESP32设备控制服务器。Backend service for xiaozhi-esp32, helps you quickly build an ESP32 device control server.
最近更新: 8个月前Shimmy 是一个超轻量级(仅 5MB)的本地 AI 推理服务器,具备与 OpenAI API 兼容的接口、自动模型发现、热切换以及工具调用功能。采用 Rust 编写的单二进制文件方案,支持 GGUF 模型和 LoRA 微调适配器,完全免费且永久开源。
最近更新: 10个月前高吞吐、低内存大模型推理引擎,其设计初衷直击行业痛点:传统推理框架在处理多请求并发时,普遍存在KV缓存内存碎片化严重、GPU利用率低下等问题。通过 PagedAttention 这一革命性技术,vLLM实现了近零浪费的KV缓存管理,同时完美兼容OpenAI API协议,让开发者无需改造现有生态...
最近更新: 11个月前