Questions tagged «parsing»

解析是指将工件分解为组成元素并捕获这些元素之间的关系。此标记不适用于有关自托管的Parse Platform(使用[parse-platform]标记)或解析特定编程语言中的错误(使用适当的语言标记)的问题。

7
使用ConfigParser读取没有节名的文件
我ConfigParser用来读取脚本的运行时配置。 我想拥有不提供部分名称的灵活性(有些脚本很简单;它们不需要“部分”)。ConfigParser将抛出NoSectionError异常,并且不接受该文件。 如何才能使ConfigParser仅仅检索(key, value)没有节名的配置文件的元组? 例如: key1=val1 key2:val2 我宁愿不写配置文件。

9
Python:如何确定语言?
我想得到这个: Input text: "ру́сский язы́к" Output text: "Russian" Input text: "中文" Output text: "Chinese" Input text: "にほんご" Output text: "Japanese" Input text: "العَرَبِيَّة" Output text: "Arabic" 如何在python中完成?谢谢。
86 python  string  parsing 

18
Java中的True-way解决方案:解析2个字符串中的2个数字,然后返回它们的总和
相当愚蠢的问题。给定代码: public static int sum(String a, String b) /* throws? WHAT? */ { int x = Integer.parseInt(a); // throws NumberFormatException int y = Integer.parseInt(b); // throws NumberFormatException return x + y; } 您能告诉我Java是否不错?我在说的NumberFormatException是一个未经检查的异常。您不必将其指定为sum()签名的一部分。而且,据我所知,未检查的异常的想法只是表明程序的实现是不正确的,甚至更多,捕获未检查的异常是一个坏主意,因为这就像在运行时修复错误的程序一样。 有人可以澄清一下: 我应该指定NumberFormatException方法签名的一部分。 我应该定义自己的检查异常(BadDataException),NumberFormatException在方法内部进行处理,然后将其重新抛出BadDataException。 我应该定义自己的检查异常(BadDataException),以某种方式(如正则表达式)验证两个字符串,BadDataException如果不匹配则将其抛出。 你的想法? 更新: 想象一下,出于某种原因,您不是应该使用开放源代码框架。您查看方法的签名并思考-“好,它永远不会抛出”。然后,有一天,您遇到了一个例外。正常吗 更新2: 有评论说我sum(String, String)的设计不好。我绝对同意,但是对于那些相信,如果我们拥有良好的设计,就不会出现原始问题,这是一个额外的问题: 问题定义是这样的:您有一个数据源,数字存储为 Strings。该源可以是XML文件,网页,带有2个编辑框的桌面窗口,无论如何。 您的目标是实现采用这2 Strings的逻辑,并将其转换为ints并显示消息框,说“和为xxx”。 无论您使用什么方法来设计/实现此功能,您都将拥有以下两点内部功能: 在那里你转换的地方String,以int 加2int秒的地方 …


10
如何有效解析固定宽度的文件?
我试图找到一种解析文件的方法,该文件包含固定宽度的线。例如,前20个字符代表一列,从21:30开始代表另一列,依此类推。 假设该行包含100个字符,将行解析为多个组件的有效方法是什么? 我可以每行使用字符串切片,但是如果行很大,这会有点难看。还有其他快速方法吗?
84 python  parsing 

9
抽象语法树和具体语法树有什么区别?
我一直在阅读一些口译/编译器的工作方式,而令我感到困惑的一个方面是AST和CST之间的区别。我的理解是,解析器生成CST,然后将其交给语义分析器,后者将其转换为AST。但是,我的理解是语义分析器只是确保遵守规则。我真的不明白为什么它会进行任何更改以使其抽象而不是具体。 关于语义分析器,我是否缺少某些东西,或者AST和CST之间的区别有些人为?

5
在Android中解析HTML
我正在尝试从网页中解析android中的HTML,由于该网页的格式不正确,我得到了SAXException。 有没有一种方法可以在Android中解析HTML?
83 android  html  parsing 

6
Flex / Bison是否可以在8位嵌入式系统上使用?
我正在使用avr-gcc工具链针对C语言的AVR微控制器上的练习,为一种简单的BASIC语言编写小型解释器。但是,我想知道是否有任何开源工具可以帮助我编写词法分析器和解析器。 如果我将其编写为在Linux机器上运行,则可以使用flex / bison。现在,我将自己限制在一个8位平台上,我是否必须手工完成所有工作?

1
在Python中解析YAML文件并访问数据?
我是YAML的新手,一直在寻找解析YAML文件和使用/访问已解析YAML数据的方法。 我遇到过有关如何解析YAML文件的解释,例如PyYAML教程“如何在Python中解析YAML文件”,“将Python字典转换为对象? ”,但是我没有找到一个关于如何从已解析的YAML文件访问数据的简单示例。 假设我有一个YAML文件,例如: treeroot: branch1: branch1 text branch2: branch2 text 如何访问文本“ branch1文本”? “ YAML解析和Python? ”提供了一个解决方案,但是我在从更复杂的YAML文件访问数据时遇到了问题。而且,我不知道是否有来自解析YAML文件,可能是类似“东西访问数据的一些标准的方式树迭代”或“ elementpath这将解析XML文件时,可以使用”符号的东西?
83 python  xml  parsing  yaml 

8
PHP:提取括号内文本的最佳方法?
提取括号之间的文本集的最佳/最有效方法是什么?假设我想以最有效的方式从字符串“忽略除此(文本)之外的所有内容”中获取字符串“ text”。 到目前为止,我想出的最好的方法是: $fullString = "ignore everything except this (text)"; $start = strpos('(', $fullString); $end = strlen($fullString) - strpos(')', $fullString); $shortString = substr($fullString, $start, $end); 有一个更好的方法吗?我知道通常使用正则表达式的效率较低,但是除非我可以减少函数调用的次数,否则这也许是最好的方法?有什么想法吗?
83 php  parsing  string 

2
使用Python进行PDF解析-提取格式化和纯文本[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。 5年前关闭。 改善这个问题 我正在寻找一个PDF库,它将允许我从PDF文档中提取文本。我看过PyPDF,它可以很好地从PDF文档中提取文本。这样做的问题是,如果文档中有表格,则表格中的文本将与文档中其余文本一起在线提取。这可能会引起问题,因为它会生成无用的文本部分,看起来有些乱码(例如,许多数字混在一起)。 我想从PDF文档中提取文本,但不包括任何表格和特殊格式。那里有图书馆吗?

5
读取XML(从字符串中)并获取一些字段-读取XML时出现问题
我有这个XML(存储在名为的C#字符串中myXML) <?xml version="1.0" encoding="utf-16"?> <myDataz xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"> <listS> <sog> <field1>123</field1> <field2>a</field2> <field3>b</field3> </sog> <sog> <field1>456</field1> <field2>c</field2> <field3>d</field3> </sog> </listS> </myDataz> 我想浏览所有<sog>元素。我想为每个孩子打印那个孩子<field1>。 这是我的代码: XmlDocument xmlDoc = new XmlDocument(); string myXML = "<?xml version=\"1.0\" encoding=\"utf-16\"?><myDataz xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xmlns:xsd=\"http://www.w3.org/2001/XMLSchema\"><listS><sog><field1>123</field1><field2>a</field2><field3>b</field3></sog><sog><field1>456</field1><field2>c</field2><field3>d</field3></sog></listS></myDataz>" xmlDoc.Load(myXML); XmlNodeList parentNode = xmlDoc.GetElementsByTagName("listS"); foreach (XmlNode childrenNode in parentNode) { HttpContext.Current.Response.Write(childrenNode.SelectSingleNode("//field1").Value); } 但似乎我无法将字符串读取为XML?我懂了System.ArgumentException
82 c#  .net  xml  parsing  xml-parsing 

6
如何从ArrayList创建逗号分隔的字符串?
我将Ids的ArrayList存储在一个处理脚本中,该脚本要以逗号分隔的列表形式吐出,以输出到调试日志。有没有一种方法可以让我轻松地做到这一点而又无需遍历事物? 编辑:感谢Joel指出了.net 2.0及更高版本中可用的List(Of T)。如果可以的话,这使TONS更加容易。
82 c#  vb.net  parsing 

16
解析URL字符串以获取键值的最佳方法?
我需要解析这样的URL字符串: &ad_eurl=http://www.youtube.com/video/4bL4FI1Gz6s&hl=it_IT&iv_logging_level=3&ad_flags=0&endscreen_module=http://s.ytimg.com/yt/swfbin/endscreen-vfl6o3XZn.swf&cid=241&cust_gender=1&avg_rating=4.82280613104 我需要将NSString拆分为诸如cid=241和的标志部分&avg_rating=4.82280613104。我一直在用,substringWithRange:但是值以随机顺序返回,所以搞砸了。是否有任何类可以轻松解析,因此您基本上可以将其转换为NSDictionary以便能够读取键的值(例如ValueForKey:cid应该返回241)。还是有比使用NSMakeRange子字符串更简单的解析方法?

5
从OpenFileDialog路径/文件名中提取路径
我正在编写一个从选择文件开始的小实用程序,然后需要选择一个文件夹。我想将文件夹默认设置为所选文件所在的位置。 OpenFileDialog.FileName返回完整的路径和文件名-我想要的只是获取路径部分(没有文件名),因此我可以将其用作初始选择的文件夹。 private System.Windows.Forms.OpenFileDialog ofd; private System.Windows.Forms.FolderBrowserDialog fbd; ... if (ofd.ShowDialog() == DialogResult.OK) { string sourceFile = ofd.FileName; string sourceFolder = ???; } ... fbd.SelectedPath = sourceFolder; // set initial fbd.ShowDialog() folder if (fbd.ShowDialog() == DialogResult.OK) { ... } 是否有任何.NET方法可以做到这一点,或者我需要使用regex, split, trim,etc吗?
81 c#  .net  parsing  path 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.