#python# 今天只做了最简单的功能,使用pyinstaller.exe -F **.py 把我的程序进行了打包,实测了一下,功能没有问题,把exe文件和初始excel放到一个文件夹下,即可实现读取初始excel中的url,然后进行数据抓取,结果保存至excel。
但是今天联想到另外一个问题,就是数据抓取是否存在法律风险,经过查看相关材料,综合网上的各种观点,整理如下:
(1)不要爬取涉及个人敏感信息的数据;
(2)如果网站有反爬措施,请不要爬取;
(3)如果网站数据为非公开内容,请不要爬取;
(4)对于公开网站,很多人都觉得数据是公开的,就可以随意使用,这是个错误观念。我在网上看到一个很恰当的比喻,商场洗手间是免费的,每个人都可以洗手,但是你开着油罐车过来装水,这就是不行的。所以公司网站,不能以商业目的(谋利)、也不能抓取大量数据(影响对方服务),除此之外,原则上没有问题。
以上这些观点您认同吗?
今日写材料时发现的一个曲线图绘制网站,可方便快捷地随机生成波浪线、折线等,亦能直接生成SVG文件导入PPT进行编辑
网页链接
我有一个好点子可以让华为手机突破16%的命运圈,希望任总能够关注并申请专利。
自从国产手机异军突起,就一直用华为手机。现在看到华为被美欧无耻联合打压,心里有心杀贼却无力回天,很不是滋味。特别是华为的鸿蒙系统,做为中国人的操作系统非常符中国人的使用习惯,如果不能生存下来,真是太可惜了。我时时刻刻都想为国产高科技出点力。今天我真发现了一个突破点。
自从有了孩子,小孩子的教育问题成了家庭的最大任务,可随处可见的电子产品成了学生向好的拦路虎,游戏,小视频对自控力差的孩子有着极大的吸引力,加上三年疫情,线上教学又不得不让孩子接触手机,家长不可能时时刻刻看着,很多孩子往往借学习名义沉迷于手机。怎么才能避免这种矛盾呢?
任总,我建议在鸿蒙系统上加入一个家长管理功能,例如:在未成年学生手机上保持基本的老年机功能外,建立一个带密码的文件夹,把学生要用的软件、网站、游戏拖入,让家长设置使用时间和使用范围,方便家长监督管理。等学生上大学成年了,家长再恢复手机的所有使用权限,这种手机家长绝对欢迎。你算算现在中国光学生占2.22亿多,随着科技的进步,电子产品必须参与到学生教育中,这种让家长放心的手机必须每个学生人手一个,那么鸿蒙系统不就一下跨过16%的生命线。缺芯也不怕,学生机不能打游戏的话,28nm足够,而这个尺寸国产是可以替代的。仼总希望你采纳呀,祝华为涅槃重生,再创辉煌,为国争光!
今天是做识典百科第34天。
昨晚给自己定了个新条目,是什么呢?依然是人物类,依然是印度人——大名鼎鼎的大文豪泰戈尔。
“泰戈尔”原本是扬帆计划里限定条目,当时我对报名流程不熟悉,就自选了“甘地”,其实超范围了。后来发现不对,又报了“泰戈尔”。没想到,系统通知“甘地”条目报名成功了,所以我就按通知照办了。
没编“泰戈尔”有点遗憾,高中时读过他的散文诗,那时买的诗集还在,只是纸张早已泛黄。每次目光扫过,脑中立马浮现出一个將自己变作一片绿叶,跟妈妈开玩笑的可爱又淘气的小孩。年岁增长,依然喜欢这些充满童趣的诗,真的很治愈。这也是我选编这个条目的一个原因。
今天主要任务是收集资料,网上泰戈尔资料很多,很容易找,登录知名期刊网站就可下载,绝大多数免费下载。有硕士、博士学位论文,还有从事南亚研究的专业人士撰写的著作,够权威的。
上次编“甘地”,我是一边搜索,一边阅读、对比、概括,体验不太好,不顺。
今天,我换一种方式,收集到一个资料后,稍加阅读,摘录有价值的信息,分类保存。也就是在“泰戈尔”文件夹里,分别建传记、哲学观、文学观、美学、主要作品等文件夹。这样分门别类,便于查阅。
为了便于阅读同类资料,我又建了一个简单的表格,只有3列。左列按传记、哲学、文学等分类。
中间列是同类资料内容,就是同一个空白格里,粘贴不同作者的同类资料。
举个例子,泰戈尔本人、泰戈尔孙女婿与中国作家写的泰戈尔传记中的个人信息,粘贴在同一个空格里。
右列是对应的作者、书名、出处,外接网址。
今天收获蛮大的,所需资料基本已到位。明天的任务是阅读、概括和编写。