欢迎访问广东乐鱼体育官网登录叉车设备有限公司官网!

广东乐鱼体育官网登录叉车设备有限公司

广东乐鱼体育官网登录叉车设备有限公司

—— 持续领航 品牌经营 ——

全国服务热线

0381-67933474
18197508990
搜索关键词:  2289

Python-今日头条新闻评论翻译-制止无效劳动,提高效率

来源:leyu乐鱼体育   发布时间:2021-12-14 00:39nbsp;  点击量:

本文摘要:本文链接:https://willisfusu.github.io/post/jin-ri-tou-tiao-2/上一篇文章我说到了由于妻子博士课题的原因,需要爬取今日头条的新闻评论,而且需要翻译成英文。我把评论的获取写成了文章,可以见此处。今天我准备把如何使用 python 将中文翻译成英文总结一下,以备参考与之后温习之用。 1 为什么会有这篇文章从妻子那里拿到的项目,她要求将今日头条的新闻评论翻译为英文,以为其博士课题服务。

leyu乐鱼体育

本文链接:https://willisfusu.github.io/post/jin-ri-tou-tiao-2/上一篇文章我说到了由于妻子博士课题的原因,需要爬取今日头条的新闻评论,而且需要翻译成英文。我把评论的获取写成了文章,可以见此处。今天我准备把如何使用 python 将中文翻译成英文总结一下,以备参考与之后温习之用。

1 为什么会有这篇文章从妻子那里拿到的项目,她要求将今日头条的新闻评论翻译为英文,以为其博士课题服务。刚开始她是想着自己翻译,厥后我我她或许需要几多评论翻译成英文,告诉我说或许800条…… 于是我就问她需不需要我先给她「机翻」一下,这样后期做较对要比自己翻译快许多。

于是我就乐成拿到了这个项目。️2 项目历程2.1 确定思路因为我自己也没有「根红苗正」的 python 学习履历,学习 python 完全是为了妻子的博士课题服务。因此这里讲到的思路可能并不是正统的法式员思路,临时看之。

读取评论内容。从我们之前存入的数据库中读取评论内容。找到谷歌翻译[1]的 API 接口,将评论传入。

处置惩罚返回的翻译效果。2.2 谷歌翻译 API 的设置与使用这一部门内容建议阅读谷歌官方给出的指南,很是详细。分为了 Basic 与 Advanced 两个版本,选择任何一个指南举行都可以完成我们翻译文本的目的。

谷歌翻译 API 可以点击这里阅读。简朴说分为以下四步:建立 Cloud Console project,并获得 Private Key (一个 json 文件)将第1步获得的 private key 添加到情况变量中设置 Google Cloud SDK (此步骤又包罗了许多小步骤)安装 google-cloud-translate==2.0.1 python 库。pip3 install google-cloud-translate==2.0.12.3 代码实现其实分析到这里,整个项目也差不多完成了。

剩下的代码部门比力简朴。可以分为两步:1.引入 google-cloud-translate 库。2. 传入评论。

引入 google-cloud-translate 库from google.cloud import translate_v2 as translate# 引入 google.cloud 库,并重命名translate_client=translate.Client()# 建立translate工具Python传入评论内容,并处置惩罚返回效果 [2]def translate_comment(col): print('开始%s翻译'% col) collection = mydb[col] collection.update_many({}, {'$set': {'Comment_English': 'none'}}) # 获取评论 collection, 而且增加'Comment_English' 字段。querry = {"Comment_English": 'none'} comment_array = collection.find({}, {'comment_text': 1}) print('已获取所有评论,准备开始翻译') for i in comment_array: ch_comment = emojis.decode(i['comment_text']) # 由于许多评论中使用了 emoji 谷歌翻译不能正确识别 emoji,所以需要使用 emoji 库将 emoji 转换为 unicode 编码。emoji 就是 ️️☺️ 这种。

result=translate_client.translate(ch_comment,target_language='en') collection.update_one(querry, {'$set': {'Comment_English': result['translatedText']}}) # 提交评论到谷歌翻译,并将返回的翻译效果更新 'Comment_English' 字段。Python因为有多条新闻,所以有许多组评论,需要再写一个 for 循环。

collectionarray = mydb.list_collection_names()i = 1for col in collectionarray: translate_comment(col) print('已经完成%d个库评论数据翻译' % i) i += 1Python2.4 说明如果是在像 pycharm 这样的 IDE 中执行上面的法式,很或许率(之所以说很或许率是因为我只在 pycharm 中运行过)遇到报错,提示谷歌凭证设置错误。不要担忧,只要你是根据上面指南设置,那应该不会有错。之所以泛起这个报错是因为只能在 cmd 或者 terminal 中运行。

到下令终端中运行刚刚写的 py 文件,看看是不是正常执行。如果还不正常,就根据上面的指南再设置一遍。️3 总结3.1 使用到库pymongo 数据库emojis 处置惩罚评论中的 emoji,防止谷歌翻译报错google.cloud 谷歌翻译库3.2 pymongo 修改/新增字段update/update_many/update_one这里选择谷歌翻译是因为人在英国,而且小我私家感受谷歌翻译可能会比力准确一点? ↩︎再次说一下,这个项目中纷歧定非得使用数据库来存储,增加新字段,并更新字段浪费了我不少时间去学习。

↩︎。


本文关键词:Python-,今日,头条,新闻,评论,翻译,制止,无效,leyu乐鱼体育

本文来源:乐鱼体育官网登录-www.lqssyq.com

微信二维码 微信二维码
联系我们

电话:0381-67933474
手机:18197508990
Q Q:184990009
邮箱:admin@lqssyq.com
联系地址:广西壮族自治区北海市明山区达建大楼12号

Copyright © 2004-2021 www.lqssyq.com. 乐鱼体育官网登录科技 版权所有

备案号:ICP备64530019号-4