PDF数据提取到PostgreSQL
亲爱的自由职业者,
我正在寻找一个人/团队,可以创建一个PDF解析器,该解析器通过二进制模式从PDF文件中提取数据。提取后,将数据放入PostgreSQL框架内构建的SQL数据库中。
所有PDF文件都是标准表单。这些形式分为部分。每个部分都有锚词,在我们的旁边,我们有文本框。此类关系也将在SQL(锚点/部分的数据点)中复制。
换句话说,我们正在提取数据并将其放入多个SQL表中,并且我们正在SQL级别的数据点之间建立关系。
语言:最好是带有数学向量的Python,但对建议开放。
数据库:PostgreSQL框架。
不会考虑OCR解决方案。
接受标准:PDF文件被馈送到系统中,该PDF的数据点存储在数据库中,并根据描述在数据界之间自动创建的关系。
如果您有兴趣,请与我联系,以便我可以提供更多信息和示例文件,以便您能够为我准备报价。