Questions tagged «parsing»

解析是指将工件分解为组成元素并捕获这些元素之间的关系。此标记不适用于有关自托管的Parse Platform(使用[parse-platform]标记)或解析特定编程语言中的错误(使用适当的语言标记)的问题。

12
在Go中逐行读取文件
我file.ReadLine在Go中找不到功能。我可以弄清楚如何快速编写一个,但是我只是想知道我是否在这里忽略了一些东西。如何逐行读取文件?
334 string  file  parsing  go  line 

4
在Python中使用设置文件的最佳做法是什么?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 2年前关闭。 改善这个问题 我有一个运行有很多参数的命令行脚本。现在到了我有太多参数的地步,我也想以字典形式有一些参数。 因此,为了简化操作,我想使用设置文件来运行脚本。我真的不知道该使用什么库来解析文件。最佳做法是什么?我当然可以自己动手做一些事情,但是如果有图书馆可以帮助我,我会不胜枚举。 一些“需求”: 与其使用pickle我,我不希望它是一个易于阅读和编辑的简单文本文件。 我希望能够在其中添加类似字典的数据,即应支持某种形式的嵌套。 简化的伪示例文件: truck: color: blue brand: ford city: new york cabriolet: color: black engine: cylinders: 8 placement: mid doors: 2

7
熊猫read_csv low_memory和dtype选项
打电话时 df = pd.read_csv('somefile.csv') 我得到: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130:DtypeWarning:列(4,5,7,16)具有混合类型。在导入时指定dtype选项,或将low_memory = False设置为false。 为什么dtype选项与关联low_memory,为什么使它False有助于解决此问题?

5
lexers vs解析器
词法分析器和解析器在理论上真的有很大不同吗? 讨厌正则表达式似乎很时髦:编码恐怖,另一篇博客文章。 但是,流行的基于词法分析的工具:pygments,geshi或prettify都使用正则表达式。他们似乎什么都没法... 什么时候足够词汇,何时需要EBNF? 有没有人将这些词法分析器生成的令牌与bison或antlr解析器生成器一起使用?
308 parsing  antlr  lexer  pygments 

5
如何在Python中解析JSON?
我的项目目前正在python中接收JSON消息,我需要从中获取一些信息。为此,我们将其设置为字符串中的一些简单JSON: jsonStr = '{"one" : "1", "two" : "2", "three" : "3"}' 到目前为止,我一直在使用列表生成JSON请求json.dumps,但是与此相反,我认为我需要使用json.loads。但是我没有那么幸运。谁能为我提供一个片段,该片段将在上述示例"2"的输入中返回"two"?
281 python  json  parsing 

30
使用JavaScript向URL添加参数
在使用AJAX调用的Web应用程序中,我需要提交一个请求,但要在URL的末尾添加一个参数,例如: 原始网址: http://server/myapp.php?id = 10 结果网址: http://server/myapp.php?id = 10 &enabled = true 寻找一种JavaScript函数,该函数解析URL并查看每个参数,然后添加新参数或更新值(如果已经存在)。

8
如何在Java中使用XPath读取XML
我想使用Java中的XPath读取XML数据,因此对于我收集的信息,我无法根据需要解析XML。 这是我想做的: 通过其URL从网上获取XML文件,然后使用XPath对其进行解析,我想在其中创建两个方法。一种是输入一个特定的节点属性ID,然后得到所有的子节点,第二种是假设我只想获得一个特定的子节点值 <?xml version="1.0"?> <howto> <topic name="Java"> <url>http://www.rgagnonjavahowto.htm</url> <car>taxi</car> </topic> <topic name="PowerBuilder"> <url>http://www.rgagnon/pbhowto.htm</url> <url>http://www.rgagnon/pbhowtonew.htm</url> </topic> <topic name="Javascript"> <url>http://www.rgagnon/jshowto.htm</url> </topic> <topic name="VBScript"> <url>http://www.rgagnon/vbshowto.htm</url> </topic> </howto> 在上面的示例中,如果我通过@name搜索,我想读取所有元素,并且还要读取一个只希望@name'Javascript'中的url返回一个节点元素的函数。
273 java  xml  parsing  xpath 

19
将URI字符串解析为Name-Value集合
我有这样的URI: https://google.com.ua/oauth/authorize?client_id=SS&response_type=code&scope=N_FULL&access_type=offline&redirect_uri=http://localhost/Callback 我需要一个具有解析元素的集合: NAME VALUE ------------------------ client_id SS response_type code scope N_FULL access_type offline redirect_uri http://localhost/Callback 确切地说,我需要C#/。NET HttpUtility.ParseQueryString方法的Java等效项。 请给我一个建议。 谢谢。

25
在Android上解析查询字符串
Java EE具有ServletRequest.getParameterValues()。 在非EE平台上,URL.getQuery()仅返回一个字符串。 当不在 Java EE上时,正确解析URL中的查询字符串的正常方法是什么? < rant > 尝试创建自己的解析器的答案很流行。这是一个非常有趣且令人兴奋的微编码项目,但我不能说这是一个好主意 :( 以下代码片段通常有缺陷或损坏,顺便说一句。打破它们对于读者来说是一个有趣的练习。 并向黑客攻击使用它们的网站。 解析查询字符串是一个定义明确的问题,但阅读规范和理解细微差别并非易事。最好让一些平台库编码器为您完成工作,并进行修复! < / rant >
271 java  android  parsing  url 

30
如何在C ++中读取和解析CSV文件?
我需要在C ++中加载和使用CSV文件数据。此时,它实际上只能是逗号分隔的解析器(即,不必担心转义新行和逗号)。主要需求是逐行解析器,每次调用该方法时,它将为下一行返回一个向量。 我发现这篇文章看起来很有希望:http : //www.boost.org/doc/libs/1_35_0/libs/spirit/example/fundamental/list_parser.cpp 我从未使用过Boost的Spirit,但愿意尝试。但是只有在没有更直接的解决方案时,我才忽略了这一点。
264 c++  parsing  text  csv 




21
如何检查C ++ std :: string是否以某个特定字符串开头,并将子字符串转换为int?
如何在C ++中实现以下(Python伪代码)? if argv[1].startswith('--foo='): foo_value = int(argv[1][len('--foo='):]) (例如,如果argv[1]is --foo=98,则foo_valueis 98。) 更新:我不愿讨论Boost,因为我只是想对一个简单的小型命令行工具进行很小的更改(我宁愿不必学习如何链接和使用Boost来进行较小的调整更改)。

13
Python:从字符串中删除\ xa0?
我目前正在使用Beautiful Soup解析HTML文件并调用get_text(),但似乎我剩下很多表示空格的\ xa0 Unicode。有没有一种有效的方法可以在Python 2.7中将其全部删除,并将其更改为空格?我想更笼统的问题是,有没有办法删除Unicode格式? 我尝试使用:line = line.replace(u'\xa0',' '),如另一个线程所建议的那样,但是将\ xa0更改为u,所以现在到处都是“ u”。): 编辑:问题似乎已通过解决str.replace(u'\xa0', ' ').encode('utf-8'),但.encode('utf-8')不这样做replace()似乎会导致它吐出甚至更奇怪的字符,例如\ xc2。谁能解释一下?
241 python  parsing  unicode 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.