我有一个.csv文件,其中包含以下数据: "Ա","Բ" 1,10 2,20 我无法将其读取为r,因此列名称显示为文件中的名称. d d
以下是关于 read.table 的编程技术问答
i有一个稀疏的数据集,其中一个列的数量在CSV格式的长度上变化.这是文件文本的示例. 12223, University 12227, bridge, Sky 12828, Sunset 13801, Ground 14853, Tranceamerica 14854, San Francisco 15595, shibuya, Shrine 16126, fog, San Francisco 16520, California, ocean, summer, golden gate, beach, San Francisco 当我使用 时 read.csv("data.txt", header = F) r将把数据集解释为具有3列,因为大小是从前5行确定的.无论如何,是否有迫使R将数据放入更多列中? 解决方案 ?read.table文档深处有以下内容: 数据列的数量是通过查看前五个来确定的 输入行(或整个文件,如果其少于五行)或 如果指定col.name
我必须使用〜2 GB(525600行x 302列)的120个文件的集合.目的是进行一些统计数据,并将结果放入干净的SQLite数据库中. 当我的脚本以read.table()导入我的脚本时,一切正常,但是很慢.因此,我已经尝试了fread. Error in fread(txt, header = T, select = c("YYY", "MM", "DD", : Not positioned correctly after testing format of header row. ch=' ' 我的数据的前2行和7行看起来像: YYYY MM DD HH mm 19490 40790 1991 10 1 1 0 1.046465E+00 1.568405E+00 因此,在开始时有一个第一个空间,然后在日期列之间只有一个空间,然后在其他列之间有一个任意数量的空间. 我尝试使用
我发现自己从过去的项目中存储的旧excel文件从这里和那里汲取了一些数据.这些文件是无组织的,我的意思是没有行的行和列的通用格式,因此将整个电子表格直接读取到R中是没有用的,大多数情况下,我只想一次一次获取几列和行数据.与其创建一个我想要的列/行的单独的文本文件,并以最简单的方式读取此文件的方法是使用read.table(text="...."),然后将我想要的数据放在text>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>中.这很好,但是当我开始抓住较大的数据集时,控制台处理信息需要更长的时间.进入非常大的功能时,我有时会遇到同样的问题.我认为这可能是对显示器中传递信息的速度的限制,但我不确定.我必须等待控制台才能传递此信息,然后才能做其他任何事情.我如何获得控制台以向我展示我的阅读速度或根本不向我展示任何内容的信息?最好是第一个. 示例数据 GNL
当我在R控制台中运行此代码时,它可以正常工作: read.csv('https://courses.edx.org/c4x/MITx/15.071x_2/asset/WHO.csv') 但是,当我尝试放入R Markdown文档并编织它时,我会得到以下内容: Error in open.connection(file, "rt") : cannot open the connection Calls: ... eval -> read.csv -> read.table -> open -> open.connection Execution halted 我也尝试使用http和url(),但没有帮助 read.csv('http://courses.edx.org/c4x/MITx/15.071x_2/asset/WHO.csv') read.csv(url('http://courses.edx.org/c4x/MITx/15.071
我有一个来自NOAA的文本文件,其中有8列的气象站列表,没有标头.它们都被空间隔开了,但是在以下情况下,有些名称为" Abbeville"其他Andalusia 3 W".当我将其阅读到r上时. USC00010008 31.5702 -85.2482 139.0 Al Abbeville 15 -6 USC00010252 31.3071 -86.5226 76.2 Al Andalusia 3 W 15 -6 precip_stations V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 >USC00010008 31.5702 -85.2482 139 AL ABBEVILLE 15 -6 >USC00010252 31.3071 -86.5
如何使用基本代码直接将FASTA文件直接读取到R中的数据框架中.这些文件存储信息生物序列(例如DNA或蛋白质),并具有n个单个生物分子(ID1至idn)的2*n行,因此是类型: >id1 #(always starts with a `>`) seq1 >id2 seq2 ... >idn seqn 如果一个人想进入基础r(而不是Biostrings和seqinr的专用软件包,它使用新颖的类来用于对生物序列的各种操纵),则如何使用,例如读取,以获取具有ID和SEQ列的简单数据框架? 解决方案 肯定可以在基础R中进行.请考虑以下示例和函数: # Demo data library(CHNOSZ) file
假设我们有一个文件名test.txt,其中包含未知数量的列: 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 6 7 8 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 fill=T当第8行的5列以上时失败: read.table('test.txt', header=F, sep='\t', fill=T) 结果: V1 V2 V3 V4 V5 1 1 2 3 4 5 2 1 2 3 4 5 3 1 2 3 4 5 4 1 2 3 4 5 5
read.table()和read.delim()在R语言中有什么区别? 解决方案 除了阅读帮助页面外,当您不确定函数的功能时,还可以检查函数的实际代码.例如,输入read.delim揭示该函数包含以下代码: > read.delim function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...) read.table(file = file, header = header, sep = sep, quote = quote, dec = dec, fill = fill, comment.char = comment.char, ...) 因此,read.delim()只是read.table()的包装函数,其默认参数值在读取选项卡分隔数据时很方便.它与调用完全相同: read.table(fi