PDF数据提取到PostgreSQL

亲爱的自由职业者,

我正在寻找一个人/团队,可以创建一个PDF解析器,该解析器通过二进制模式从PDF文件中提取数据。提取后,将数据放入PostgreSQL框架内构建的SQL数据库中。

所有PDF文件都是标准表单。这些形式分为部分。每个部分都有锚词,在我们的旁边,我们有文本框。此类关系也将在SQL(锚点/部分的数据点)中复制。

换句话说,我们正在提取数据并将其放入多个SQL表中,并且我们正在SQL级别的数据点之间建立关系。

语言:最好是带有数学向量的Python,但对建议开放。
数据库:PostgreSQL框架。

不会考虑OCR解决方案。

接受标准:PDF文件被馈送到系统中,该PDF的数据点存储在数据库中,并根据描述在数据界之间自动创建的关系。

如果您有兴趣,请与我联系,以便我可以提供更多信息和示例文件,以便您能够为我准备报价。

来源:https://eleduck.com/posts/4lfqKQ