Questions tagged «csv»

逗号分隔值或字符分隔值(CSV)是一种标准的“平面文件数据库”格式,用于以纯文本格式存储表格数据,由可选的标题行组成,该标题行列出了用逗号或制表符或其他分隔符分隔的表格字段,然后是一行或多行(用换行符分隔),这些行将表记录表示为值的定界列表。换行符和分隔符可以出现在(带引号)字段中。

3
为什么csvwriter.writerow()在每个字符后加逗号?
此代码打开url并/names在末尾附加,然后打开页面并将字符串打印到test1.csv: import urllib2 import re import csv url = ("http://www.example.com") bios = [u'/name1', u'/name2', u'/name3'] csvwriter = csv.writer(open("/test1.csv", "a")) for l in bios: OpenThisLink = url + l response = urllib2.urlopen(OpenThisLink) html = response.read() item = re.search('(JD)(.*?)(\d+)', html) if item: JD = item.group() csvwriter.writerow(JD) else: NoJD = "NoJD" csvwriter.writerow(NoJD) 但是我得到这个结果: …
97 python  csv 


5
熊猫read_csv并使用usecols过滤列
我有一个csv文件,pandas.read_csv当我使用过滤列usecols并使用多个索引时,该文件输入不正确。 import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", "x"], parse_dates=["date"]) print df1 # Ignore the dummy columns df2 = pd.read_csv('foo.csv', index_col=["date", "loc"], usecols=["date", "loc", "x"], …

6
CSV导入熊猫时跳过行
我正在尝试使用导入.csv文件pandas.read_csv(),但是我不想导入数据文件的第二行(索引为0的索引为1的行)。 我看不到如何不导入它,因为与命令一起使用的参数似乎模棱两可: 从熊猫网站: skiprows :类列表或整数 文件开头要跳过的行号(索引为0)或要跳过的行数(整数)。” 如果输入skiprows=1参数,它如何知道是跳过第一行还是跳过索引为1的行?
97 python  csv  pandas 


6
数据帧的选定列中包含NA(缺失)值的行的子集
我们有一个来自CSV文件的数据框。数据框DF具有包含观察值的列和VaR2包含测量日期的列()。如果未记录日期,则CSV文件包含值NA,用于丢失数据。 Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们想使用subset命令定义一个新的数据框new_DF,使其仅包含具有NA'列(VaR2)中的值的行。在给出的示例中,新行中仅包含第2行DF。 命令 new_DF<-subset(DF,DF$Var2=="NA") 不起作用,结果数据框没有行条目。 如果在原始CSV文件NA中交换 了值NULL,则同一命令将产生所需的结果:new_DF<-subset(DF,DF$Var2=="NULL")。 如果字符串的值NA在原始CSV文件中提供,如何使该方法起作用?
96 r  csv  dataframe  subset  na 


17
将多行字符串转换为单逗号分隔
假设我有以下字符串: something1: +12.0 (some unnecessary trailing data (this must go)) something2: +15.5 (some more unnecessary trailing data) something4: +9.0 (some other unnecessary data) something1: +13.5 (blah blah blah) 我如何将其变成简单 +12.0,+15.5,+9.0,+13.5 b?
95 string  bash  shell  csv 

9
使用Python读取UTF8 CSV文件
我正在尝试使用Python读取带重音字符的CSV文件(仅法语和/或西班牙语字符)。基于csvreader的Python 2.5文档(http://docs.python.org/library/csv.html),我提出了以下代码来读取CSV文件,因为csvreader仅支持ASCII。 def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily as UTF-8: csv_reader = csv.reader(utf_8_encoder(unicode_csv_data), dialect=dialect, **kwargs) for row in csv_reader: # decode UTF-8 back to Unicode, cell by cell: yield [unicode(cell, 'utf-8') for cell in row] def utf_8_encoder(unicode_csv_data): for line in unicode_csv_data: yield line.encode('utf-8') filename = …

5
如何将CSV文件中的标头从CSV文件复制到PostgreSQL表?
我想将CSV文件复制到Postgres表中。该表中大约有100列,因此,如果不需要,我不想重写它们。 我正在使用\copy table from 'table.csv' delimiter ',' csv;命令,但没有创建表,我得到了ERROR: relation "table" does not exist。如果我添加一个空白表,则不会出现任何错误,但是什么也不会发生。我尝试了两次或三次此命令,但没有输出或消息,但是当我通过PGAdmin检查表时,表并未更新。 有没有办法像我想要的那样导入包含标题的表?

10
从命令行将mysql数据库转储到纯文本(CSV)备份中
我想避免mysqldump,因为它以仅便于mysql读取的形式输出。CSV似乎更通用(每个表一个文件就可以了)。但是,如果mysqldump有优势,我会很高兴。另外,我希望可以从命令行(linux)运行某些内容。如果那是mysql脚本,那么指向如何制作此类内容的指针将很有帮助。

5
如何从JDBC结果集中获取列数?
我正在使用CsvJdbc(它是用于csv文件的JDBC驱动程序)来访问csv文件。我不知道csv文件包含多少列。如何获得列数?是否有任何JDBC函数?我在java.sql.ResultSet中找不到任何方法。 为了访问文件,我使用类似于CsvJdbc网站上示例的代码。
92 java  jdbc  csv  resultset 

4
使用“ sort”命令按列优先级对CSV文件进行排序
我有一个csv文件,我想按列优先级对其进行排序,例如“ order by”。例如: 3;1;2 1;3;2 1;2;3 2;3;1 2;1;3 3;2;1 如果这种情况是“选择”的结果,则“ order by”将如下所示:order by column2,column1,column3-结果将是: 2;1;3 3;1;2 1;2;3 3;2;1 1;3;2 2;3;1 我想知道如何在Unix上使用“ sort”命令获得相同的结果。

9
将字典写入csv文件,每个“键:值”一行
我有一本字典: mydict = {key1: value_a, key2: value_b, key3: value_c} 我想以这种方式将数据写入dict.csv文件: key1: value_a key2: value_b key3: value_c 我写: import csv f = open('dict.csv','wb') w = csv.DictWriter(f,mydict.keys()) w.writerow(mydict) f.close() 但是现在我将所有键都放在一行中,而所有值都在下一行中。 当我设法写一个这样的文件时,我也想将其读回到新的字典中。 只是为了解释我的代码,该词典包含来自textctrls和复选框的值和布尔值(使用wxpython)。我要添加“保存设置”和“加载设置”按钮。保存设置应以上述方式将字典写入文件中(使用户更容易直接编辑csv文件),加载设置应从文件中读取并更新textctrl和复选框。
90 python  csv  dictionary 

9
导入CSV文件作为pandas DataFrame
将CSV文件读入pandas DataFrame的Python方法是什么(然后可以将其用于统计操作,可以具有不同类型的列等)? 我的CSV文件"value.txt"具有以下内容: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 在R中,我们将使用以下命令读取此文件: price <- read.csv("value.txt") 这将返回R data.frame: > price <- read.csv("value.txt") > price Date price factor_1 factor_2 1 2012-06-11 1600.20 1.255 1.548 2 2012-06-12 1610.02 1.258 1.554 3 2012-06-13 1618.07 1.249 1.552 4 2012-06-14 1624.40 1.253 1.556 5 2012-06-15 1626.15 …
90 python  pandas  csv  dataframe 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.