CUDA推理结果有问题 #13

Ivy233 · 2024-09-12T10:01:46Z

音频来源：iic/SenseVoiceSmall模型，examples/zh.mp3
用ffmpeg转成-ar 16000的wav。
CPU推理的结果：

GPU（4080Super）推理的结果：

nvidia-smi信息：

lovemefan · 2024-09-12T10:05:19Z

CUDA适配包括Metal适配都卡在某一个算子上了，适配好了会在这个issue留言并发布release

Ivy233 · 2024-09-23T02:52:09Z

问一手，现在有进展吗（）

lovemefan · 2024-09-24T05:51:12Z

问一手，现在有进展吗（）

最近忙了点😂，国庆尝试修复下

Ivy233 · 2024-09-25T14:39:04Z

对照--no-gpu，目前已经确认到有三个地方有问题：

sense-voice-encoder.cpp那边encoder_layer_sanm_forward里，一开始的USE_CUDA对于norm的处理有问题，自己的代码已经修复这个问题。检测了几个值是完全一样的，先放一边了。
第一层后续的QKV矩阵乘法中，对照发现会有0.001的误差，由于后续内容的存在，目前无法确认是否因为这个导致输出乱码，不过个人认为影响不是很大，除非后面的错误修复后还有乱码否则不考虑这个。
fsmn中的im2col基本确认是有问题的，似乎没有正确运行（具体原因还需要还在查）。

lovemefan · 2024-09-25T14:55:06Z

我是通过放开下面代码注释，打印tensor里面的值来对比的

SenseVoice.cpp/sense-voice/csrc/sense-voice-encoder.cc

Line 527 in 0881ea5

    
           //        ggml_backend_sched_set_eval_callback(sched, ctx.params.cb_eval, ctx.params.cb_eval_user_data);

由于第一层的norm的维度为560，560不是32的倍数，在ggml中会报错，后续通过pad均值到576（32的倍数），可正常计算。是否还有其他错误，如有欢迎指出或pr
精度方面有一点损失，不是乱码主要原因。
主要原因是im2col算子的问题，该问题在metal和cuda都存在。我在官方提了issue, 但是还没有回复，我个人排查起来非常困难。

Ivy233 · 2024-09-25T15:19:05Z

第三点+1，简直有毒，要不手写？
第一点不是因为norm的32倍数问题，在扩展后，norm的560变成了576，对应的标准差也需要做缩放变换，表现在代码上是在计算最后加一个scale，倍率就是sqrt(576/560)。

lovemefan · 2024-09-25T15:31:08Z

norm没有注意到有个scale，感谢指出。im2col我看看再排查一下，先看看官方能不能修复，实在不行再想办法手写吧

Ivy233 · 2024-09-26T02:10:13Z

第一点pr已经提了，注释内和没注释的都是可以跑的，都可以测一下。

Ivy233 · 2024-10-06T13:42:05Z

今天是修好了吗，我今天up之后发现看起来结果正常了。想问下是怎么解决的？

lovemefan · 2024-10-06T14:33:23Z

我把im2col算子单独放在cpu上计算，虽然相比全放在gpu上损失了部分速度，im2col能够跑通了。但是我自己测试在V100没跑通😂，cuda上的softmax出现nan了，所以没发release。

lovemefan · 2024-10-07T10:12:50Z

CUDA 12.0测试正常，最新 CUDA 12.6出现nan，等官方修复了

lovemefan added the bug Something isn't working label Sep 12, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CUDA推理结果有问题 #13

CUDA推理结果有问题 #13

Ivy233 commented Sep 12, 2024

lovemefan commented Sep 12, 2024

Ivy233 commented Sep 23, 2024

lovemefan commented Sep 24, 2024

Ivy233 commented Sep 25, 2024

lovemefan commented Sep 25, 2024

Ivy233 commented Sep 25, 2024

lovemefan commented Sep 25, 2024 •

edited

Loading

Ivy233 commented Sep 26, 2024

Ivy233 commented Oct 6, 2024

lovemefan commented Oct 6, 2024

lovemefan commented Oct 7, 2024

CUDA推理结果有问题 #13

CUDA推理结果有问题 #13

Comments

Ivy233 commented Sep 12, 2024

lovemefan commented Sep 12, 2024

Ivy233 commented Sep 23, 2024

lovemefan commented Sep 24, 2024

Ivy233 commented Sep 25, 2024

lovemefan commented Sep 25, 2024

Ivy233 commented Sep 25, 2024

lovemefan commented Sep 25, 2024 • edited Loading

Ivy233 commented Sep 26, 2024

Ivy233 commented Oct 6, 2024

lovemefan commented Oct 6, 2024

lovemefan commented Oct 7, 2024

lovemefan commented Sep 25, 2024 •

edited

Loading