程序设计 parsing

12

我file.ReadLine在Go中找不到功能。我可以弄清楚如何快速编写一个，但是我只是想知道我是否在这里忽略了一些东西。如何逐行读取文件？

334 string file parsing go line

4

已关闭。这个问题需要更加集中。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过编辑此帖子来关注一个问题。 2年前关闭。改善这个问题我有一个运行有很多参数的命令行脚本。现在到了我有太多参数的地步，我也想以字典形式有一些参数。因此，为了简化操作，我想使用设置文件来运行脚本。我真的不知道该使用什么库来解析文件。最佳做法是什么？我当然可以自己动手做一些事情，但是如果有图书馆可以帮助我，我会不胜枚举。一些“需求”：与其使用pickle我，我不希望它是一个易于阅读和编辑的简单文本文件。我希望能够在其中添加类似字典的数据，即应支持某种形式的嵌套。简化的伪示例文件： truck: color: blue brand: ford city: new york cabriolet: color: black engine: cylinders: 8 placement: mid doors: 2

332 python parsing configuration yaml settings

7

熊猫read_csv low_memory和dtype选项

打电话时 df = pd.read_csv('somefile.csv') 我得到： /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130：DtypeWarning：列（4,5,7,16）具有混合类型。在导入时指定dtype选项，或将low_memory = False设置为false。为什么dtype选项与关联low_memory，为什么使它False有助于解决此问题？

320 python parsing numpy pandas dataframe

5

lexers vs解析器

词法分析器和解析器在理论上真的有很大不同吗？讨厌正则表达式似乎很时髦：编码恐怖，另一篇博客文章。但是，流行的基于词法分析的工具：pygments，geshi或prettify都使用正则表达式。他们似乎什么都没法... 什么时候足够词汇，何时需要EBNF？有没有人将这些词法分析器生成的令牌与bison或antlr解析器生成器一起使用？

308 parsing antlr lexer pygments

5

如何在Python中解析JSON？

我的项目目前正在python中接收JSON消息，我需要从中获取一些信息。为此，我们将其设置为字符串中的一些简单JSON： jsonStr = '{"one" : "1", "two" : "2", "three" : "3"}' 到目前为止，我一直在使用列表生成JSON请求json.dumps，但是与此相反，我认为我需要使用json.loads。但是我没有那么幸运。谁能为我提供一个片段，该片段将在上述示例"2"的输入中返回"two"？

281 python json parsing

30

使用JavaScript向URL添加参数

在使用AJAX调用的Web应用程序中，我需要提交一个请求，但要在URL的末尾添加一个参数，例如：原始网址： http：//server/myapp.php？id = 10 结果网址： http：//server/myapp.php？id = 10 ＆enabled = true 寻找一种JavaScript函数，该函数解析URL并查看每个参数，然后添加新参数或更新值（如果已经存在）。

276 javascript url parsing parameters query-string

8

如何在Java中使用XPath读取XML

我想使用Java中的XPath读取XML数据，因此对于我收集的信息，我无法根据需要解析XML。这是我想做的：通过其URL从网上获取XML文件，然后使用XPath对其进行解析，我想在其中创建两个方法。一种是输入一个特定的节点属性ID，然后得到所有的子节点，第二种是假设我只想获得一个特定的子节点值 <?xml version="1.0"?> <howto> <topic name="Java"> <url>http://www.rgagnonjavahowto.htm</url> <car>taxi</car> </topic> <topic name="PowerBuilder"> <url>http://www.rgagnon/pbhowto.htm</url> <url>http://www.rgagnon/pbhowtonew.htm</url> </topic> <topic name="Javascript"> <url>http://www.rgagnon/jshowto.htm</url> </topic> <topic name="VBScript"> <url>http://www.rgagnon/vbshowto.htm</url> </topic> </howto> 在上面的示例中，如果我通过@name搜索，我想读取所有元素，并且还要读取一个只希望@name'Javascript'中的url返回一个节点元素的函数。

273 java xml parsing xpath

19

将URI字符串解析为Name-Value集合

我有这样的URI： https://google.com.ua/oauth/authorize?client_id=SS&response_type=code&scope=N_FULL&access_type=offline&redirect_uri=http://localhost/Callback 我需要一个具有解析元素的集合： NAME VALUE ------------------------ client_id SS response_type code scope N_FULL access_type offline redirect_uri http://localhost/Callback 确切地说，我需要C＃/。NET HttpUtility.ParseQueryString方法的Java等效项。请给我一个建议。谢谢。

273 java parsing uri namevaluecollection

25

在Android上解析查询字符串

Java EE具有ServletRequest.getParameterValues（）。在非EE平台上，URL.getQuery（）仅返回一个字符串。当不在 Java EE上时，正确解析URL中的查询字符串的正常方法是什么？ < rant > 尝试创建自己的解析器的答案很流行。这是一个非常有趣且令人兴奋的微编码项目，但我不能说这是一个好主意 :( 以下代码片段通常有缺陷或损坏，顺便说一句。打破它们对于读者来说是一个有趣的练习。并向黑客攻击使用它们的网站。解析查询字符串是一个定义明确的问题，但阅读规范和理解细微差别并非易事。最好让一些平台库编码器为您完成工作，并进行修复！ < / rant >

271 java android parsing url

30

如何在C ++中读取和解析CSV文件？

我需要在C ++中加载和使用CSV文件数据。此时，它实际上只能是逗号分隔的解析器（即，不必担心转义新行和逗号）。主要需求是逐行解析器，每次调用该方法时，它将为下一行返回一个向量。我发现这篇文章看起来很有希望：http : //www.boost.org/doc/libs/1_35_0/libs/spirit/example/fundamental/list_parser.cpp 我从未使用过Boost的Spirit，但愿意尝试。但是只有在没有更直接的解决方案时，我才忽略了这一点。

264 c++ parsing text csv

17

如何在C ++中将字符串解析为int？

将字符串（以char *给定）解析为int的C ++方法是什么？强大而清晰的错误处理是一个加号（而不是返回零）。

260 c++ parsing

8

如何在JavaScript中将字符串转换为float？

我正在尝试从数据网格解析两个值。这些字段是数字，并且当它们有逗号（例如554,20）时，我无法在逗号后得到数字。我试过parseInt和parseFloat。我怎样才能做到这一点？

255 javascript parsing floating-point

7

在Java中，如何将XML解析为字符串而不是文件？

我有以下代码： DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(xmlFile); 如何获取它来解析包含在字符串而不是文件中的XML？

249 java xml string file parsing

21

如何检查C ++ std :: string是否以某个特定字符串开头，并将子字符串转换为int？

如何在C ++中实现以下（Python伪代码）？ if argv[1].startswith('--foo='): foo_value = int(argv[1][len('--foo='):]) （例如，如果argv[1]is --foo=98，则foo_valueis 98。）更新：我不愿讨论Boost，因为我只是想对一个简单的小型命令行工具进行很小的更改（我宁愿不必学习如何链接和使用Boost来进行较小的调整更改）。

242 c++ string parsing substring startswith

13

Python：从字符串中删除\ xa0？

我目前正在使用Beautiful Soup解析HTML文件并调用get_text()，但似乎我剩下很多表示空格的\ xa0 Unicode。有没有一种有效的方法可以在Python 2.7中将其全部删除，并将其更改为空格？我想更笼统的问题是，有没有办法删除Unicode格式？我尝试使用：line = line.replace(u'\xa0',' ')，如另一个线程所建议的那样，但是将\ xa0更改为u，所以现在到处都是“ u”。）：编辑：问题似乎已通过解决str.replace(u'\xa0', ' ').encode('utf-8')，但.encode('utf-8')不这样做replace()似乎会导致它吐出甚至更奇怪的字符，例如\ xc2。谁能解释一下？

241 python parsing unicode

Questions tagged «parsing»