最近要把公司的公共邮箱的邮件抓到本地,然后做一层权限控制和操作记录。
一开始我使用的 python 的 pop3 去抓取邮件,但是会缺失一些数据,比如邮件的发件人名称、还有一些邮件内容也会缺失。
为什么 fixmail 这些客户端软件都不会缺失数据??,他们是怎么实现的? 难道不也是抓 pop 服务器的?
有什么好建议吗? 怎么将邮箱数据更好的同步到本地数据库里?

最近要把公司的公共邮箱的邮件抓到本地,然后做一层权限控制和操作记录。
一开始我使用的 python 的 pop3 去抓取邮件,但是会缺失一些数据,比如邮件的发件人名称、还有一些邮件内容也会缺失。
为什么 fixmail 这些客户端软件都不会缺失数据??,他们是怎么实现的? 难道不也是抓 pop 服务器的?
有什么好建议吗? 怎么将邮箱数据更好的同步到本地数据库里?
1 TimePPT PRO 描述里看不出哪个环节出了问题,下到本地的邮件头完整吗?一般头里有收发件人信息 |
2 x66 Jul 7, 2020 名称应该是通过通讯录读取出来的吧。 |
3 bworker OP 我就是用 python 的 popLib 库解析不出来,估计是这个库的问题 |
4 MadbookPro Jul 7, 2020 是不是没有对 Content-Transfer-Encoding 做相应的处理? 7bit 8bit base64 quoted-printable 等等 |
5 wangkun025 Jul 7, 2020 开启 imap,不就是同步了嘛 不理解为啥会缺失数据。邮件本身就是个文件。 |
6 bworker OP 缺失数据,好像是编码的问题 |
7 bworker OP @MadbookPro 怎么去处理? |
8 None123 Jul 7, 2020 别用 pop3 用 IMAP |
9 None123 Jul 7, 2020 pop3 得到的数据不全 |
10 MadbookPro Jul 7, 2020 @bworker #7 参考 [rfc2045]( https://tools.ietf.org/html/rfc2045) ,我没用过 python,但是 python 会有标准库的。 |
11 Ritter Jul 7, 2020 我现在也在弄这个 用 IMAP 协议 可以用 GitHub 上面这个库(Imbox)[https://github.com/martinrusev/imbox] 自己解析太麻烦了 |