这一期我们主要做的就是PDE转MD功能的实现,可以本地模型OCR或者接入此类型的API,不过还是推荐API,成本低实现方式快。

选择PDF OCR

其实识别PDF的API并不多,我也试用过国内外很多家OCR厂商,只有Mistral AI效果最佳,所以我们今天要接入的就是mistral-ocr模型,可以轻松实现功能。

创建API keys

我们登录Mistral AI管理中心,点击API keys区域,再点击Crerta new key来创建key,key只会显示一次切记要保存哦~

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图

接入mistral-ocr API

既然已经选择mistral-ocr API,我们直接让Cursor来接入吧!

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图1

接入速度倒是挺快的,接入成功后在.env.local添加前面获取的key值。

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图2

我们来尝试功能看看是否可用?一开始就报错,没办法只能把终端报错继续投喂回去让它修改。

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图3

报错修改了两次还是有问题,直接投喂官方文档,让它根据官方文档来修复问题。

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图4

根据官方文档修改后还是会有报错,我们复制浏览器控制台的报错让它找到问题自动修复。

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图5

最后来回拉扯了不下于10次终于解决问题成功接入API咯~

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图6

解决问题小技巧

不管是任何功能让AI来新增或解决BUG大概率都不会一次通过,出现问题不要紧,直接把报错投喂给它,它会自动修复。

当然并不是无厘头的投喂,总结我之前的经验,有问题先投喂官方文档,再出现报错可以浏览器控制台报错,终端报错都投喂给它,这样解决的速度相对来说会快点。

现在功能已经初步实现,感兴趣的可以观看我们下一期视频哦~



微信扫描下方的二维码阅读本文

商业项目实战篇四:用Cursor接OCR API,网站PDF转MD超简单插图7

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。