python把第x列数据写入第x个文件
问题描述
Python爬虫一共需要爬取65页数据,每页数据的列数不确定。现在我能把每一列的数据抓下来,但是因为列数不确定,写入的文件名就不能确定。问题在于怎么才能把第x列数据写入第x个文件。也就是如何才能动态选择file=的文件名。代码如下:
f_1 = open(’fitment/1.txt’, ’a’)f_2 = open(’fitment/2.txt’, ’a’)f_3 = open(’fitment/3.txt’, ’a’)for i in range(66): pr = random.choice(proxy) url = ’https://*****’ + str(i) + ’****’ page_url = requests.get(url, headers=head, proxies=pr) page_get = page_url.text page_text = BeautifulSoup(page_get, ’lxml’) fitment_1 = page_text.find_all(’tr’, {’class’: ’fitment listRowEven’}) for each_tag_1 in fitment_1:td_text_1 = each_tag_1.find_all(’td’)for x in range(len(td_text_1)+1): print(td_text_1[x].string, file=)
网页的结构类如下,每个tr标签即为一列,具体要抓取的数据位于每个td标签内
<tr> <td>...</td> <td>...</td> <td>...</td> <td>...</td></tr><tr> <td>...</td> <td>...</td> <td>...</td> <td>...</td></tr>
问题解答
回答1:先不要定义好open文件对象,可以根据列数打开相应的文件操作
with open(’列数.txt’, ’a’) as f: f.write(’内容’)
相关文章:
1. node.js - Angular-webpack-Starter, 怎么把NodeJS添加进项目里?2. mysql - Java单元测试如何测试修改数据库部分的代码?3. java - web端百度网盘的一个操作为什么要分两次请求服务器, 有什么好处吗4. android - 微信这个效果是怎么实现的5. python小白 自学看书遇到看不懂的地方6. 找一个权威、实战的微信扫码授权登录网站的开发教程或者文章7. python - JWT, django如何定制关于用户的Permission?8. PHP中的$this代表当前的类还是方法?9. phpadmin的数据库,可以设置自动变化时间的变量吗?就是不需要接收时间数据,自动变化10. PHP类封装的插入数据,总是插入不成功,返回false;
