使用biopython在pubmed上进行搜索
我正试图将超过200个条目输入PubMed,以记录作者发表的文章数量,并通过包括他/她的导师和机构来完善搜索.我尝试使用Biopython和XLRD(代码为下面)来执行此操作,但是我一直在获得所有三种查询格式的0个结果(1.用名称,2.按名称和机构名称,以及3.按名称和名称和名称和导师的名字).是否可以进行故障排除的步骤,或者在使用下面指示的PubMed搜索的关键字时,我应该使用其他格式? 输入查询的示例输出; search_term是一个链接列表,带有输入查询的列表. print(*search_term[8:15], sep='\n') [text:'Andrew Bland', 'Weill Cornell Medical College', text:'David Cutler MD'] [text:'Andy Price', 'University of Alabama at Birmingham School of Medicine', text:'Jason
46 2024-03-31
编程技术问答社区
在使用xlsxwriter关闭后,再使用xlrd读取excel文件时,无法读取表格的值。
在FISRT上,我使用XLSXWriter在一个单元格中编写一个简单的公式,然后关闭 *.xlsx文件.然后,我尝试读取单元格的值,但仅在同一程序下使用XLRD从单元格中读取" 0". 如果我在单元格中读取了一些固定值(例如字符串或常数数),则可以很好地工作. 如果我在 *.xlsx文件中手动创建一个公式单元,则XLRD也可以获取公式的值. 似乎只有在写一个论坛以 *.xlsx然后在同一程序中读取该论坛时,我才能读取公式单元的值. python:3.4.3 XLRD:1.0.0 XLSXWriter:0.9.3 import xlrd import xlsxwriter name = 'abc.xlsx' sheet_name = 'sheet1' # write a formula in 'D1' as '=A1+C1' out_book = xlsxwriter.Workbook(name, {'im_memory': True}) out_sheet =
20 2023-12-20
编程技术问答社区
将Excel文件的文件夹转换为CSV文件/合并Excel工作簿
我有一个带有大量Excel工作簿的文件夹.是否可以使用Python的XLRD,Xlutiles和XlsxWriter? 将此文件夹中的每个文件转换为CSV文件 我希望新转换后的CSV文件具有扩展名'_convert.csv'. 否则... 有没有办法合并文件夹中的所有Excel工作簿以创建一个大文件? 我一直在寻找两者都做的方法,但是什么都没有用... 解决方案 使用 pywin32 ,这将在指示目录并打开并将其重新以.csv为单位.用pywin32弄清楚正确的命令是相对容易的...只需记录一个Excel宏并手动执行打开/保存,然后查看结果的宏. import os import glob import win32com.client xl = win32com.client.gencache.EnsureDispatch('Excel.Application') for f in glob.glob('tmp/*.xlsx'): full
34 2023-12-20
编程技术问答社区
对于有超链接的单元格,OpenPyXL总是返回无。
(我的最终目的是append clickable cells to existing XLSX.) 我使用下面的代码提取单元格的显示值和超链接. from openpyxl import load_workbook xlsFile='hello.xlsx' wbook = load_workbook(xlsFile) wsheet1= wbook.get_sheet_by_name('mysheet') cell1 = wsheet1.cell('A1') print cell1.value print cell1.hyperlink print wsheet1['A1'].value print wsheet1['A1'].hyperlink 但它返回以下内容: URL1 None URL1 None 为什么hyperlink总是None?我确实为单元A1手动添加了超链接,并且超链接在Excel 2013中工作. . 解决方案 不幸的是,这是一个错误
32 2023-12-20
编程技术问答社区
Python/Excel-IOError: [Errno 2] 没有这样的文件或目录:
试图从文件中提取.xlsx文档并将数据编译到一个工作表中. 尽管存在文件,但还是接收ioError 程序如下 #-------------- loop that pulls in files from folder-------------- import os #create directory from which to pull the files rootdir = r'C:\Users\username\Desktop\Mults' for subdir, dir, files in os.walk(rootdir): for file in files: print os.path.join(subdir,file) #----------------------merge work books----------------------- import xlrd import xlsxwriter wb = xlsxwriter.Work
26 2023-12-20
编程技术问答社区
如何使用XLRD读取格式并在Python中写下XLSXWriter
我正在使用XLRD读取Excel文件.进行一些宏替换,然后通过XLSXWriter编写.无需阅读和复制格式信息,代码可以工作,但是当我添加格式化信息时,我会收到错误(在底部) 代码片段如下..我读取了一个XLS文件,对于每个数据行,我用值替换令牌宏并写回.当我尝试关闭output_workbook时,我会收到错误 filePath = os.path.realpath(os.path.join(inputPath,filename)) input_workbook = open_workbook(filePath, formatting_info=True) input_DataSheet = input_workbook.sheet_by_index(0) data = [[input_DataSheet.cell_value(r,c) for c in range(input_DataSheet.ncols)] for r in range(in
24 2023-12-20
编程技术问答社区
使用Python编写一个Excel文件,其中有从另一个Excel文件复制的列
我有一个包含不同列数的excel文件,我想使用python循环通过该文件的某些列(来自其标题行值),然后将这些列写入(复制)到另一个Excel文件. 有什么例子有关我如何做到这一点? 解决方案 以下是一些选择: xlwt (写XLS文件) xlrd (阅读xls/xlsx文件) OpenPyXl (阅读/写作xlsx文件) xlsxwriter (写xlsx文件) 如果您只需要复制数据(不用格式化信息),则只需使用这些工具的任何组合来读取/写作即可.如果您有一个xls文件,则应使用XLRD+XLWT选项. 这是将第一行从现有Excel文件复制到新的简单示例: import xlwt import xlrd workbook = xlrd.open_workbook('input.xls') sheet = workbook.sheet_by_index(0) data = [sheet.cell_value(0, col) for col in
40 2023-12-20
编程技术问答社区
用python处理大型XLSX文件
我有一个大的XLSX Excel文件(56MB,550K行),我尝试从中读取前10行.我尝试使用xlrd,openpyxl和pyexcel-xlsx,但是它们总是花费35分钟以上,因为它将整个文件加载到内存中. 我解开了Excel文件,发现包含我需要的数据的xml是800MB解压缩. 在Excel中加载相同的文件时,需要30秒.我想知道为什么在Python中需要这么多时间? 解决方案 使用 OpenPyXl的单纯读模式这样做. 您将能够立即与相关的工作表合作. 其他解决方案 这是,我找到了一个解决方案.阅读XLSX表的最快方法. 56MB文件,超过500k行,4张纸进行了6张. import zipfile from bs4 import BeautifulSoup paths = [] mySheet = 'Sheet Name' filename = 'xlfile.xlsx' file = zipfile.ZipFile(filena
38 2023-12-20
编程技术问答社区
如何用 python 3 打开 xlsx 文件
我有一个带有1张纸的XLSX文件. 我正在尝试使用Python 3(xlrd lib)打开它,但是我得到一个空文件! 我使用此代码: file_errors_location = "C:\\Users\\atheelm\\Documents\\python excel mission\\errors1.xlsx" workbook_errors = xlrd.open_workbook(file_errors_location) 我没有错误,但是当我输入时: workbook_errors.nsheets 我得到" 0",甚至文件都有一些床单...当我输入时: workbook_errors 我得到: xlrd.book.Book object at 0x2.. 有帮助吗?谢谢 解决方案 您可以使用pandas pandas.read_excel就像pandas.read_csv: import pandas as pd fi
18 2023-12-20
编程技术问答社区
读取excel时使用pandas的断言错误
我正在尝试使用pandas读取xlsx文件. 我以前已经做过数千次,但某种原因它不使用特定文件. 使用Pandas阅读时,我从另一个来源下载了该文件,我会得到一个essertionerror(请参阅结束): df = pandas.read_excel(pathtomyfile, sheetname = "Sheet1") 变量是为路径定义的.该路径存在(OS.Path.exists(路径)返回true). 当我复制文件的内容并将值粘贴到新的excel文档中时,此新的将使用read_excel()方法打开. 当我复制文件的内容并将格式粘贴到新的excel中时, 这个新的将使用read_excel()方法打开. 它似乎不是值或格式. 我猜这可能是一个编码的问题吗? 谢谢您的任何帮助. df1 = pandas.read_excel(snap1) File "C:\Python\python-3.4.4.amd64\lib\site-
40 2023-12-20
编程技术问答社区
从 xls 文件中删除列
使用Python,我需要能够对Excel 2007的工作簿进行以下操作: 1.DELETE COLUMS 我正在研究xlrd;但是. 任何人都可以告诉我怎么做? 解决方案 如果您在Python 3.x工作,则使用xlrd/xlwt/xlutils家庭发现很多麻烦,因为它们是Python 2的模块. 您可以考虑 如果您只需要将值转换为(忽略格式化等),则是一种方法.您可以以此为基础: from openpyxl import load_workbook from openpyxl.cell import column_index_from_string as col_index from openpyxl.cell import get_column_letter as col_letter def del_col(s, col, cmax=None, rmax=None): col_num = col_index(col) - 1 co
24 2023-12-20
编程技术问答社区
xlrd读取xls XLRDError。不支持的格式,或损坏的文件。期待BOF记录;发现'\r\n<html>'。
这是代码: xls = open_workbook('data.xls') 回报: File "/home/woles/P2/fin/fin/apps/data_container/importer.py", line 16, in import_data xls = open_workbook('data.xlsx') File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/__init__.py", line 435, in open_workbook ragged_rows=ragged_rows, File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/book.py", line 91, in open_workbook_xls biff_version = bk.getbof(XL_WORKBOOK_GLO
38 2023-12-20
编程技术问答社区
使用xlrd读取含有中文和/或印地语字符的Excel xls文件
从上面的链接中,我使用此实用程序读取XLS文件.如果XLS文件包含不同的语言字符,例如中文或印地语,则无法正确输出它们.有解决方法吗? 谷歌搜索后,我发现了这个: import xlrd def upload_xls(dir,file,request): try: global msg global row_num row_num = [] header_arr = [] global file_path file_path = dir #reader = csv.reader(open(file), delimiter='#', quotechar='"') book = xlrd.open_workbook('dodgy.xls',encoding='cp1252') ##To specify UTF8-encoding
34 2023-12-20
编程技术问答社区
如何检查.xls和.csv文件是否是空的
问题1:如何检查整个.xls或.csv文件是否为空.这是我正在使用的代码: try: if os.stat(fullpath).st_size > 0: readfile(fullpath) else: print "empty file" except OSError: print "No file" 一个空的.xls文件的大小大于5.6kb,因此它是否具有任何内容并不明显. 如何检查XLS或CSV文件是否为空? 问题2:我需要检查文件的标题. 我该如何告诉python只是一个排空间的文件? import xlrd def readfile(fullpath) xls=xlrd.open_workbook(fullpath) for sheet in xls.sheets(): number_of_rows = sheet.nrows number_of_co
24 2023-12-20
编程技术问答社区
在Python中使用xlrd将Excel的数字数据读成文本
我正在尝试使用XLRD在Excel文件中读取,我想知道是否有一种方法可以忽略Excel文件中使用的单元格格式,而只是将所有数据导入文本? 这是我在远处使用的代码: import xlrd xls_file = 'xltest.xls' xls_workbook = xlrd.open_workbook(xls_file) xls_sheet = xls_workbook.sheet_by_index(0) raw_data = [['']*xls_sheet.ncols for _ in range(xls_sheet.nrows)] raw_str = '' feild_delim = ',' text_delim = '"' for rnum in range(xls_sheet.nrows): for cnum in range(xls_sheet.ncols): raw_data[rnum][cnum] = str(xls_sheet.c
30 2023-12-20
编程技术问答社区
在python中使用xlrd、xlwt和xlutils从excel文件中删除行数
大家好,谢谢你. 我有一个python脚本,我在其中打开一个模板excel文件,添加数据(同时保留样式)并再次保存.我希望能够在保存新的XLS文件之前删除我没有编辑的行.我的模板XLS文件有一个页脚,所以我想在页脚之前删除多余的行. 这是我加载XLS模板的方式: self.inBook = xlrd.open_workbook(file_path, formatting_info=True) self.outBook = xlutils.copy.copy(self.inBook) self.outBookCopy = xlutils.copy.copy(self.inBook) 我然后将信息写入Outbook,同时从OutbookCopy获取样式并将其应用于我在Outbook中修改的每一行. 那么,在编写账面之前,如何从outbook中删除行?谢谢大家! 解决方案 我使用Pandas软件包实现了.... import pandas as pd
66 2023-12-20
编程技术问答社区
用python xlrd从Excel单元格获取公式
我必须将算法从Excel表到Python Code ,但我必须从Excel文件. excel片非常复杂,其中包含许多元件,其中有公式指的是其他单元(也可以包含一个公式或常数). 我的想法是用python脚本分析床单在单元格之间构建依赖性表的表格,即: A1取决于B4,C5,E7公式:" = SQRT(B4)+C5*E7" A2取决于B5,C6公式:" = sin(b5)*c6" ... xlrd python模块允许阅读XLS工作簿,但此刻我可以访问单元的值,而不是公式. 例如,使用以下代码,我可以简单地获得单元格的值: import xlrd #open the .xls file xlsname="test.xls" book = xlrd.open_workbook(xlsname) #build a dictionary of the names->sheets of the book sd={} for s in book.sheets(
58 2023-12-20
编程技术问答社区
为什么我的 python 代码返回文本:'我的字符串',而不只是我的字符串?
我的代码片段看起来像这样: for current_row in range(worksheet.nrows): fname_text = worksheet.row(current_row)[0] lname_text = worksheet.row(current_row)[1] cmt = worksheet.row(current_row)[2] print (fname_text, lname_text, cmt) 此打印: text:'firstname' text:'lastname' text'the cmt line' 我只想返回: firstname lastname the cmt line 我需要改变什么才能实现这一目标? 解决方案 这就是Cell对象的样子: >>> sheet.row(0) [text:u'RED', text:u'RED', empty:''] >>> sheet.r
20 2023-12-20
编程技术问答社区
Pyth-Excel。寻找一列中的第一条空行
从我的最后一个问题开始工作,我设法获得了大量的方式来完成我的系统.当然,我遇到了一个问题. 我基本上有一个玩游戏的程序.每个正确的答案将10个添加到全局变量"点"中.然后,我想将"点"添加到Excel电子表格中. 这是我被卡住的地方.我正在运行XLRD-0.8.0,Xlutils-1.4.1和XLWT-0.7.5. 当然我查找了不同的东西,但它们似乎对我不起作用. 这是我的代码的简化版本: import pygame, pygame.font, pygame.event, string, xlwt, xlrd, xlutils, socket points = 0 def Uploadpoints(wbname): global points wb = xlrd.open_workbook(wbname) # CODE TO FIND FIRST EMPTY CELL IN COLUMN 1 GOES HERE
24 2023-12-20
编程技术问答社区
用数据框架将列表写入新的excel xlsx中
我很难找到将列表写入已加载的Excel表,然后将结果保存为XLSX的最佳方法.我希望我的代码要做的是获取我创建的列表,并将它们放入已加载工作簿的特定列中.我认为使用DataFrames可能会有一种更简单的方法来执行此操作,但我不知道如何进行操作.理想情况下,我想保存已加载的工作簿的格式. col_test = [1L, 2L, 3L, 4L, 5L] 我的代码是这个 import xlrt from xlrd import open_workbook rb = open_workbook("Excel FDT Master_01_update.xlsx") s = rb.sheet_by_name('INPUT') r = 5 for test in col_test: s.cell(row = r, column = 1).value = test r += 1 rb.save('didthiswork.xlsx') 解决方案 该错误意味着Pyth
24 2023-12-20
编程技术问答社区