< 返回

PDF数据提取到PostgreSQL

亲爱的自由职业者，

我正在寻找一个人/团队，可以创建一个PDF解析器，该解析器通过二进制模式从PDF文件中提取数据。提取后，将数据放入PostgreSQL框架内构建的SQL数据库中。

所有PDF文件都是标准表单。这些形式分为部分。每个部分都有锚词，在我们的旁边，我们有文本框。此类关系也将在SQL（锚点/部分的数据点）中复制。

换句话说，我们正在提取数据并将其放入多个SQL表中，并且我们正在SQL级别的数据点之间建立关系。

语言：最好是带有数学向量的Python，但对建议开放。
数据库：PostgreSQL框架。

不会考虑OCR解决方案。

接受标准：PDF文件被馈送到系统中，该PDF的数据点存储在数据库中，并根据描述在数据界之间自动创建的关系。

如果您有兴趣，请与我联系，以便我可以提供更多信息和示例文件，以便您能够为我准备报价。