提高生产效率工具的使用

MinerU

地址:https://github.com/opendatalab/MinerU,转pdf公式为markdown公式

下载模型通过修改环境变量来修改huggface cache的地址,否则默认地址是C:\Users\Adminstrator\.cache\huggingface\hub

1
2
os.environ["HF_HOME"] = "E:\hub"
os.environ["HUGGINGFACE_HUB_CACHE"] = "E:\hub"

下载模型

1
2
3
pip install huggingface_hub
wget https://github.com/opendatalab/MinerU/raw/master/scripts/download_models_hf.py -O download_models_hf.py
python download_models_hf.py

如果已经下载model要执行一遍python download_models_hf.py,才能使环境变量生效。

配环境

1
2
3
conda create -n MinerU python=3.10
conda activate MinerU
pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com

调用命令

1
magic-pdf -p AttGAN.pdf -o AttGAN