[BUG]目前语音转文字急需解决的BUG #3718

lckj2009 opened this issue Mar 20, 2024 · 19 comments

[BUG]目前语音转文字急需解决的BUG #3718

lckj2009 opened this issue Mar 20, 2024 · 19 comments


from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="./zh.wav")

File "C:\Users\ww\anaconda3\envs\pps\lib\site-packages\paddlespeech\cli\asr\", line 335, in postprocess
return self._outputs["result"]
KeyError: 'result'


指定模型看看,应该就行 参考#3697

指定模型看看,应该就行 参考#3697


这是我的pip list: 操作系统WIN10

absl-py 2.1.0
aiohttp 3.9.3
aiosignal 1.3.1
annotated-types 0.6.0
antlr4-python3-runtime 4.9.3
anyio 4.3.0
astor 0.8.1
asttokens 2.4.1
async-timeout 4.0.3
attrs 23.2.0
audioread 3.0.1
Babel 2.14.0
bce-python-sdk 0.9.5
blinker 1.7.0
bokeh 3.3.4
boltons 23.1.1
boto3 1.34.60
botocore 1.34.60
bottle 0.12.25
Bottleneck 1.3.8
braceexpand 0.1.7
cachetools 5.3.3
certifi 2024.2.2
cffi 1.16.0
chardet 3.0.4
charset-normalizer 3.3.2
click 8.1.7
colorama 0.4.6
coloredlogs 15.0.1
colorlog 6.8.2
common 0.1.2
comtypes 1.3.1
contourpy 1.2.0
cycler 0.12.1
Cython 3.0.9
daal 2021.2.3
data 0.4
datasets 2.18.0
decorator 5.1.1
dill 0.3.4
Distance 0.1.3
dual 0.1.0
dynamo3 0.4.10
editdistance 0.8.1
einops 0.7.0
exceptiongroup 1.2.0
executing 2.0.1
fastapi 0.110.0
filelock 3.13.1
Flask 3.0.2
flask-babel 4.0.0
flatbuffers 24.3.7
flywheel 0.5.4
fonttools 4.49.0
frozenlist 1.4.1
fsspec 2024.2.0
ftfy 6.1.3
funcsigs 1.0.2
future 1.0.0
g2p-en 2.1.0
gensim 4.3.2
google-api-core 2.17.1
google-auth 2.28.2
google-cloud-speech 2.25.1
googleapis-common-protos 1.63.0
googletrans 3.0.0
grpcio 1.62.1
grpcio-status 1.62.1
h11 0.9.0
h2 3.2.0
h5py 3.10.0
hpack 3.0.0
hstspreload 2024.3.1
httpcore 0.9.1
httpx 0.13.3
huggingface-hub 0.21.4
humanfriendly 10.0
hyperframe 5.2.0
HyperPyYAML 1.2.2
idna 2.10
inflect 7.0.0
intervaltree 3.1.0
ipython 8.22.2
itsdangerous 2.1.2
jedi 0.19.1
jieba 0.42.1
Jinja2 3.1.3
jmespath 1.0.1
joblib 1.3.2
jsonlines 4.0.0
kaldiio 2.18.0
kiwisolver 1.4.5
librosa 0.8.1
llvmlite 0.42.0
loguru 0.7.2
lxml 5.1.0
markdown-it-py 3.0.0
MarkupSafe 2.1.5
matplotlib 3.8.3
matplotlib-inline 0.1.6
mdurl 0.1.2
mido 1.3.2
mock 5.1.0
more-itertools 10.2.0
mpmath 1.3.0
multidict 6.0.5
nara-wpe 0.0.9
networkx 3.2.1
nltk 3.8.1
note-seq 0.0.3
numba 0.59.0
numpy 1.26.4
omegaconf 2.3.0
onnx 1.15.0
onnxruntime 1.17.1
openai-whisper 20231117
OpenCC 1.1.7
opencc-python-reimplemented 0.1.7
opt-einsum 3.3.0
packaging 23.2
paddle 1.0.2
paddle-bfloat 0.1.7
paddle2onnx 1.0.6
paddleaudio 1.1.0
paddlefsl 1.1.0
paddlenlp 2.6.1
paddlepaddle 2.5.1
paddlesde 0.2.5
paddleslim 2.6.0
paddlespeech 1.4.1
paddlespeech-feat 0.1.0
pandas 2.2.1
parameterized 0.9.0
parso 0.8.3
pathlib 1.0.1
pathos 0.2.8
pattern-singleton 1.2.0
peewee 3.17.1
pillow 10.2.0
pip 23.3.1
platformdirs 4.2.0
pocketsphinx 5.0.3
pooch 1.8.1
portalocker 2.8.2
pox 0.3.4
ppdiffusers 0.19.4
praatio 5.1.1
pretty-midi 0.2.10
prettytable 3.10.0
prompt-toolkit 3.0.43
proto-plus 1.23.0
protobuf 3.20.2
prox 0.0.17
psutil 5.9.8
pure-eval 0.2.2
pyarrow 15.0.1
pyarrow-hotfix 0.6
pyasn1 0.5.1
pyasn1-modules 0.3.0
PyAudio 0.2.14
pybind11 2.11.1
pycparser 2.21
pycryptodome 3.20.0
pydantic 2.6.4
pydantic_core 2.16.3
pydub 0.25.1
Pygments 2.17.2
pygtrie 2.5.0
pyparsing 3.1.2
pypinyin 0.44.0
pypinyin-dict 0.8.0
pypiwin32 223
pyreadline3 3.4.1
PySocks 1.7.1
pytest-runner 6.0.1
python-dateutil 2.9.0.post0
python-geoip-python3 1.3
pyttsx3 2.90
pytz 2024.1
pywin32 306
pyworld 0.3.4
PyYAML 6.0.1
pyzmq 25.1.2
rarfile 4.1
regex 2023.12.25
requests 2.31.0
requests-mock 1.11.0
resampy 0.4.3
rfc3986 1.5.0
rich 13.7.1
rsa 4.9
ruamel.yaml 0.18.6
ruamel.yaml.clib 0.2.8
s3transfer 0.10.0
sacrebleu 2.4.1
safetensors 0.4.2
scikit-learn 1.4.1.post1
scipy 1.12.0
sentencepiece 0.2.0
seqeval 1.2.2
setuptools 68.2.2
six 1.16.0
smart-open 7.0.1
sniffio 1.3.1
sortedcontainers 2.4.0
sounddevice 0.4.6
soundfile 0.12.1
SpeechRecognition 3.10.1
srt 3.5.3
stack-data 0.6.3
starlette 0.36.3
swig 4.2.1
sympy 1.12
tabulate 0.9.0
tbb 2021.11.0
TextGrid 1.6.1
threadpoolctl 3.3.0
tight 0.1.0
tiktoken 0.6.0
timer 0.2.2
ToJyutping 0.2.3
torch 2.2.1
tornado 6.4
tqdm 4.66.2
traitlets 5.14.2
trampoline 0.1.2
typeguard 2.13.3
typer 0.9.0
typing_extensions 4.10.0
tzdata 2024.1
urllib3 1.26.18
uvicorn 0.28.0
visualdl 2.5.3
vosk 0.3.45
wcwidth 0.2.13
webrtcvad 2.0.10
websockets 12.0
Werkzeug 3.0.1
wheel 0.41.2
win32-setctime 1.1.0
wrapt 1.16.0
xxhash 3.4.1
xyzservices 2023.10.1
yacs 0.1.8
yarl 1.9.4
zhon 2.0.2

你先试试命令行的方式能不能用,如果命令行都不能用的话就是你的版本可能有冲突,试试paddleenlp 2.5.2版本试试

我自己在window10上面也装成功了,命令行和Python api都能跑通

开发者你好,感谢关注 PaddleSpeech 开源项目,抱歉给你带来了不好的开发体验,目前开源项目维护人力有限,建议参考#3660

开发者你好,感谢关注 PaddleSpeech 开源项目,抱歉给你带来了不好的开发体验,目前开源项目维护人力有限,建议参考#3660


你先试试命令行的方式能不能用,如果命令行都不能用的话就是你的版本可能有冲突,试试paddleenlp 2.5.2版本试试 Screenshot_2024-03-22-20-02-48-050_net.csdn.csdnplus.jpg

我之前是在aistudio平台上面安装的 你可以参考这个安装教程看看,说不定有帮助 我自己在window10上面也装成功了,命令行和Python api都能跑通

File "C:\Users\ww\anaconda3\envs\PaddleSpeechceshi\lib\site-packages\paddlespeech\s2t\models\u2\", line 532, in attention_rescoring
assert speech.shape[0] == speech_lengths.shape[0]
IndexError: list index out of range
KeyError: 'result'


试过了,还是不行。 File "C:\Users\ww\anaconda3\envs\PaddleSpeechceshi\lib\site-packages\paddlespeech\s2t\models\u2\", line 532, in attention_rescoring assert speech.shape[0] == speech_lengths.shape[0] IndexError: list index out of range KeyError: 'result'


paddlespeech-ctcdecoders WIN10应该是装不上

Copy link

777sfdf commented Apr 12, 2024

1.这个问题之前我也提问过 当时问题出现的原因跟这个类似 最终解决办法是对python降级 使用3.8的版本 具体版本是3.8.18(#3660 ) 有提到过
paddlenlp 2.4.8
paddlepaddle 2.4.2
paddlespeech 1.4.1
2.我看你使用的是好像ancoda 但是路径是在c盘中了 不知道跟这个是否有关 我用的是MiniConda 软件所有者选择当前用户 并且安装位置是在非系统盘
3.paddlespeech 出问题是很正常的 版本有变化 或者是环境有变化了 就很容易出现问题的 多翻翻issue 或许会有答案的
4.还有最后一个建议 提问题 有时候像这么长的依赖列表不用都放的 核心地方 截图就可以了 标清测试环境 使用的代码 出错的原因 期望结果即可 太长的问题 大家很少愿意回答的

不知道问题解决没 方法如下(只是建议): 1.这个问题之前我也提问过 当时问题出现的原因跟这个类似 最终解决办法是对python降级 使用3.8的版本 具体版本是3.8.18(#3660 ) 有提到过 同时paddle相关版本如下 paddlenlp 2.4.8 paddlepaddle 2.4.2 paddlespeech 1.4.1 2.我看你使用的是好像ancoda 但是路径是在c盘中了 不知道跟这个是否有关 我用的是MiniConda 软件所有者选择当前用户 并且安装位置是在非系统盘 3.paddlespeech 出问题是很正常的 版本有变化 或者是环境有变化了 就很容易出现问题的 多翻翻issue 或许会有答案的 4.还有最后一个建议 提问题 有时候像这么长的依赖列表不用都放的 核心地方 截图就可以了 标清测试环境 使用的代码 出错的原因 期望结果即可 太长的问题 大家很少愿意回答的


Could not fetch URL There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='mirro', port=443): Max retries exceeded with url: /pypi/simple/paddlenlp/ (Caused by SSLError(SSLZeroReturnError(6, 'TLS/SSL connection has been c
losed (EOF) (_ssl.c:1131)'))) - skipping
ERROR: Could not find a version that satisfies the requirement paddlenlp==2.4.8 (from versions: none)
ERROR: No matching distribution found for paddlenlp==2.4.8
Could not fetch URL There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='mirror.baid', port=443): Max retries exceeded with url: /pypi/simple/pip/ (Caused by SSLError(SSLZeroReturnError(6, 'TLS/SSL connection has been closed (EOF)
(_ssl.c:1131)'))) - skipping

paddlenlp 2.4.8目前即使是百度源也连不上了。

pzchu commented Apr 21, 2024

paddlespeech系列 ocr系列和paddlepaddle之间的版本对应关系,简直是个灾难,一会儿那边更新了得升级,这边就报bug了

vivisol commented May 17, 2024

我一开始安装的是paddlepaddle-GPU ==2.6.1, 没有成功,也是报上面的的return self._outputs["result"] KeyError: 'result'错误,后来换成paddlepaddle==2.4.2就可以了,注意:是用的CPU版本,不是GPU版本

我一开始安装的是paddlepaddle-GPU ==2.6.1, 没有成功,也是报上面的的return self._outputs["result"] KeyError: 'result'错误,后来换成paddlepaddle==2.4.2就可以了,注意:是用的CPU版本,不是GPU版本


遇到同样的问题,为什么不直接提供pip能直接运行的包版本。matplotlib scipy numpy还要自己手动降版本

