admin管理员组文章数量:815114
[使用node.js在pdf中获取特定信息
[大规模地,我试图从api获取大量合同,这些合同包含pdf文件,其中包含合同的详细信息。提取这些文件后,我正在使用“ pdf-parse”()node.js库读取pdf的文本。
现在我的问题是:我如何设法从那些文件中读取某些值?例如,在pdf的开头,应该有合同双方的简介。我想获取签名方的名称和电子邮件,其格式如下,几乎在pdf的开头。属性名称为偶数,并且信息以偶数点开头。
Name Mark Jackson
Address Winston Street 13
Email Mark@[email protected]
Etc... ABCD...
什么样的方法会让我得到这些,并且只有合同的这些属性?
回答如下:a = `Name Mark Jackson
Address Winston Street 13
Email Mark@[email protected]
Etc... ABCD...
`;
您可以像这样轻松地提取您的姓名和电子邮件:
const name = a.match(/Name\s+(.*?)\n/, 'm')[1].trim();
const email = a.match(/Email\s+(.*?)\n/, 'm')[1].trim();
本文标签: 使用nodejs在pdf中获取特定信息
版权声明:本文标题:[使用node.js在pdf中获取特定信息 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1715209128a822543.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论