极术社区
注册
首页
AI开放平台
Top 专栏
读书
专题
问答
公开课
活动
注册 · 登录
▲
嵌入式AI
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
关注专栏
管理
关注数
18946
内容数
1456
最新文章
爱笑的小姐姐
· 2024年07月31日
SGLang:LLM推理引擎发展新方向
22
阅读 5.7k
AI学习者
· 2024年07月22日
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching
24
阅读 2.5k
AI学习者
· 2024年07月08日
窥探Triton的lower(二)
17
阅读 2.4k
爱笑的小姐姐
· 2024年07月02日
北理工提出 LTrack 双摄像头系统 | 专注于暗场景多目标跟踪,自动驾驶和夜间监控的福音!
6
阅读 4.1k
爱笑的小姐姐
· 23 分钟前
FP4DiT:扩散 Transformer 模型 FP4 量化的革命性突破,开启边缘部署新时代
0
阅读 4
爱笑的小姐姐
· 1 天前
在 96 个 H100 GPU 上部署具有 PD 分解和大规模专家并行性的 DeepSeek
1
阅读 164
爱笑的小姐姐
· 2 天前
在 SGLang 中实现 Flash Attention 后端 - 基础和 KV 缓存
0
阅读 247
爱笑的小姐姐
· 4月30日
3.5 倍能效突破,Attention 和 Softmax 的 AI 加速器实现
0
阅读 454
下冰雹
· 4月29日
Qwen3:思深,行速
2
阅读 613
AI学习者
· 4月29日
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
8
阅读 691
爱笑的小姐姐
· 4月29日
EdgeLLM:数据并行、端到端编译器与混合精度的 CPU-FPGA 加速架构
0
阅读 570
爱笑的小姐姐
· 4月28日
图解 Vllm V1 系列 1:整体流程
2
阅读 601
爱笑的小姐姐
· 4月27日
工业异常检测新范式,自Prompt+多块特征聚合,Mask精准定位小缺陷,双基准性能领跑
1
阅读 601
爱笑的小姐姐
· 4月25日
ML-Triton:Intel 在 Triton GPU 编程的多级编译与语言扩展的工作
1
阅读 712
AI学习者
· 4月24日
使用机器学习与深度学习技术的编译器优化调研
1
阅读 577
爱笑的小姐姐
· 4月24日
MobilePlantViT 破局边缘 AI | 0.69M 超轻混合 ViT 实现 99% 分类
1
阅读 561
爱笑的小姐姐
· 4月23日
Paddle-MLIR:编译时间减少 20%!边缘智能设备 AI 加速的革命性突破
1
阅读 586
爱笑的小姐姐
· 4月22日
一起聊聊 Nvidia Hopper 新特性之计算切分
2
阅读 491
爱笑的小姐姐
· 4月21日
为二值神经网络扩展 NPU 二值 GEMM 核心功能单元和编译器
10
阅读 278
爱笑的小姐姐
· 4月18日
一起聊聊 Nvidia Hopper 新特性之 TMA
12
阅读 1.7k
AI学习者
· 4月17日
通用的边缘 AI 加速器编译器:完美融合剪枝、量化与异构调度!
1
阅读 428
爱笑的小姐姐
· 4月17日
LLM 技术报告系列 | Google 团队正式放出 Gemma 3 技术报告
0
阅读 452
爱笑的小姐姐
· 4月16日
CARL2010:一种利用领域特定语言可重构性的方法论
1
阅读 192
爱笑的小姐姐
· 4月15日
Strong-Baseline架构,无特征增强问鼎反无人机挑战赛
0
阅读 413
爱笑的小姐姐
· 4月14日
Tensor-001 矩阵乘法分块乘法概述
0
阅读 395
爱笑的小姐姐
· 4月11日
高分辨率特征+多分支交互注意力,先验增强攻克噪声模糊,3个数据集mAP全面领跑
1
阅读 487
爱笑的小姐姐
· 4月10日
DeepSeek-V3+SGLang: 推理优化
7
阅读 1.7k
爱笑的小姐姐
· 4月9日
视觉反馈驱动+动态规则细化,7B模型性能跃升50%,碾压10倍大模型
1
阅读 733
爱笑的小姐姐
· 4月7日
TVM Relax:通过跨层次抽象实现动态 shape 的 LLM 高效部署
2
阅读 719
爱笑的小姐姐
· 4月3日
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的技巧
3
阅读 820
爱笑的小姐姐
· 4月2日
Mobile-MMLU:专注真实端侧场景下大模型性能厮杀的 Benchmark 数据集
1
阅读 859
爱笑的小姐姐
· 4月1日
MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache共享
1
阅读 776
爱笑的小姐姐
· 3月31日
HPCA2015:基于机器学习的 GPGPU 性能与功耗估计模型
13
阅读 1.3k
爱笑的小姐姐
· 3月28日
32B 本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
1
阅读 772
上一页
1
2
3
4
5
…
下一页
专栏作者
爱笑的小姐姐
7725 声望 · 18996 粉丝
AI学习者
11509 声望 · 12733 粉丝
棋子
13940 声望 · 4700 粉丝
下冰雹
6540 声望 · 1680 粉丝
小白会长
60 声望 · 0 粉丝
Jack-Cui
370 声望 · 4 粉丝
Xiaohang
80 声望 · 3 粉丝
云鹤
605 声望 · 1864 粉丝
nihui
860 声望 · 21 粉丝
AI老铁
2100 声望 · 899 粉丝
黎明灰烬
285 声望 · 2 粉丝
张新栋
1625 声望 · 12 粉丝
Rocky X
755 声望 · 2 粉丝
圈圈虫
777 声望 · 32 粉丝
梁德澎
755 声望 · 14 粉丝
派大星
2680 声望 · 18 粉丝
Hanson
110 声望 · 8 粉丝
杨二凯
1508 声望 · 29 粉丝
极术小姐姐
64602 声望 · 60173 粉丝
JackLi
2384 声望 · 40 粉丝
关注极术微信号
实时接收点赞提醒和评论通知
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
关注安谋科技招聘
实时获取安谋科技中国职位信息
用户指南
·
用户协议
·
隐私政策
关于我们
·
联系合作
粤ICP备18004469号
粤公网安备 44030502008014号
版权所有 © 2025 极术社区
由
SegmentFault
提供技术支持
友情链接
安谋科技
安创空间
开源中国
InfoQ
边缘计算社区
21IC 电子网
HarmonyOS 技术社区
电子芯吧客
CSDN
全志在线
芒果派
深度强化学习实验室
智东西