从 Python 初学者到高效使用:我使用 FastAPI 和 PyMuPDF 的经验

Description of your first forum.
Post Reply
suchona.kani.z
Posts: 194
Joined: Sat Dec 21, 2024 5:54 am

从 Python 初学者到高效使用:我使用 FastAPI 和 PyMuPDF 的经验

Post by suchona.kani.z »

在这篇博文中,我描述了我从 Python 初学者到 REST 服务(初级)开发人员的历程。我使用 FastAPI、PyMuPDF 和其他组件创建了一个 REST 服务来搜索和突出显示 PDF 文件中的文本。该应用程序作为 Docker 容器运行。

这篇博文首先讲述了我的学习历程。然后,我将介绍解决方案的技术细节、遇到的挑战和应用示例。最后,我描述了进一步的发展机会并给出了结论。

我要感谢我尊敬的同事 Marc Fabian Metzger,感谢他为这篇博文提供的灵感以及他在项目开发过程中提供的反馈。

我的学习历程
我的背景:我是一名IT管理顾问,但目前担任IT顾问或IT项 澳大利亚 whatsapp 数据​ 目经理。在我的私人生活中,我使用基于 Docker 的私有云,偶尔为云和/或家庭自动化开发脚本。在这个项目之前,我已经用 Python 完成了一些小任务。

这个项目的想法是在一个关于使用 Aleph Alpha Luminous API 及其功能来生成使用所谓的解释找到的信息源的培训课程中产生的。我当前的客户是一家法定健康保险公司,计划在未来依靠人工智能支持进行文件研究 - 例如在异议流程中。为了让劳动力和自治机构接受这些程序,人工智能结果的可追溯性非常重要。要研究的文件以 PDF 文件形式提供,因此标记这些文件中找到的信息是有意义的。

由于我发现 Python 非常容易自学,所以我别无选择,只能选择 Python 3。首先,我在原型中实现了应用程序的核心功能。最耗时的部分是寻找和测试合适的 Python PDF 库,这导致使用 PyMuPDF。在从慕尼黑到汉堡的长途火车旅行结束时,我有一个脚本可以在 PDF 中搜索特定文本并向文本添加注释。

然后我使用 Flask 创建了第一个 REST 服务。一位同事提到他使用FastAPI框架而不是Flask。 FastAPI 和 Flask 是使用 Python 3.x 创建 API 的 Web 框架。由于能够询问同事是否有任何挑战,我将 API 切换为 FastAPI。在“迁移”到FastAPI之后,这个决定非常有帮助:由于FastAPI中Swagger的集成,创建的结果可以直接在浏览器中测试,而且在作者看来,FastAPI有很好的文档记录。在处理 FastAPI 的同时,我还了解了 Pydantic 所使用的对象和其他 Python 库的基本知识。
Post Reply