Questions tagged «html»

超文本标记语言(HTML)是用于显示网页和其他可在Web浏览器中显示的信息的主要标记语言。

19
简单的命令行HTTP服务器
我有一个脚本可以生成每日报告,并希望将其提供给所谓的公众。问题是我不想增加所有配置和安全隐患的HTTP服务器(例如Apache)的维护工作。 是否有一个死的简单解决方案来提供一个小的HTML页面,而无需配置完整的HTTP服务器?


4
是否有一个简单的Bash工具可以快速呈现基本HTML?
我不时需要做一个简单的任务,将基本的HTML输出到控制台。我希望将其最小化渲染,以使其一目了然。是否有一个实用程序可以在外壳程序中处理基本的HTML渲染(想想Lynx样式的渲染-但不是实际的浏览器)? 例如,有时我会watch在Apache mod_status页面上放一个: watch -n 1 curl http://some-server/server-status 该页面的输出是带有一些最小标记的HTML,在shell中显示如下: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <html><head> <title>Apache Status</title> </head><body> <h1>Apache Server Status for localhost</h1> <dl><dt>Server Version: Apache/2.2.22 (Ubuntu) PHP/5.3.10-1ubuntu3.15 with Suhosin-Patch</dt> <dt>Server Built: Jul 22 2014 14:35:25 </dt></dl><hr /><dl> <dt>Current Time: Wednesday, 19-Nov-2014 15:21:40 UTC</dt> <dt>Restart Time: Wednesday, 19-Nov-2014 …

4
如何在Shell中解析数​​百个html源代码文件?
我有数百个html源代码文件。我需要<div>从每个文件中提取特定元素的内容,因此我将编写一个脚本来遍历每个文件。元素结构如下: <div id='the_div_id'> <div id='some_other_div'> <h3>Some content</h3> </div> </div> 谁能建议我the_div_id一种使用linux命令行从文件中提取div 以及所有子元素和内容的方法?

7
两个标签之间的文字
我想<tr> </tr>从html文档中检索这两个标签之间的任何内容。现在,我没有任何特定的html要求可以保证html解析器。我只是简单地需要一些匹配的东西,<tr>并</tr>在两者之间获取所有内容,并且可能会有多个trs。我尝试了awk,它可以工作,但是由于某种原因,它最终给了我提取的每一行的副本。 awk ' /<TR/{p=1; s=$0} p && /<\/TR>/{print $0 FS s; s=""; p=0} p' htmlfile> newfile 怎么办呢?

1
在Mutt中外部打开html附件
我最近设法设置了我的mailcap,以便mutt可以在消息窗口中显示HTML电子邮件: # ~/.mailcap text/html; lynx -dump '%s' | more; nametemplate=%s.html; copiousoutput; 通过以下方式实现自动化: # ~/.muttrc auto_view text/html 尽管我认为lynx在将HTML转换为文本方面做得不错,但是有时这样做并不能解决问题,我希望能够在Web浏览器(luakit)中打开HTML附件。 有没有办法透明地做到这一点?对我来说,好的工作流程如下: 打开邮件(lynx将其转换) 看到它太复杂了 lynx 按“ v” 导航到HTML附件 按“输入”以打开邮件luakit。
19 mutt  browser  html  lynx 

1
如何将HTML传送到lynx?
我正在从控制台测试一些ajax调用。我喜欢摆脱HTML标记的元信息干扰,而只是读取内容,因此我喜欢将其通过管道传输到终端浏览器,例如lynx。 然而: curl www.google.de | lynx 只是打开一个新的天猫实例。 我不想: curl www.google.de > someFile.html && lynx someFile.html
11 pipe  curl  html  stdin  lynx 

5
如何不使用groff将Linux手册页转换为HTML?
我想在不使用groff的情况下将一些Linux手册页转换为HTML。我对groff的偏见是由于某些PNG渲染问题,它似乎使我本地化为Sabayon(因为这些问题似乎在我的VirtualBox VM上并未出现在其他发行版中)。我意识到这是一个错误,但是解决方案似乎不会在不久的将来出现,所以我想问一下是否还有其他方法可以将Linux手册页转换为HTML。使用http://linux.die.net/man上的HTML页面是不可接受的解决方案,因为我感兴趣的某些手册页不存在(例如,emerge(1)不存在)。
11 man  conversion  html 

1
将剪贴板中的HTML保存为Markdown文本
我希望能够突出显示网页的一部分并将其复制到剪贴板,然后将其作为markdown保存到我的本地磁盘中。我需要一种有效的方法来做到这一点。 我当前麻烦的方法是: 突出显示部分并复制到剪贴板 打开Libre Office Writer 粘贴到作家 将Writer文档另存为HTML 打开终端 cd 到我保存HTML的目录 pandoc -s -r html /home/me/a/b/mydoc.html -o /home/me/a/b/mydoc.md 显然,我需要一个更好的方法!有什么建议么?

4
将CSV转换为HTML表
我有一个Medical.csv文件,其行格式如下, field: 'participation.type', displayName: 'program_type', type: 'String',path:'participation' field: 'participation.program', displayName: 'program_name', type: 'String',path:'participation' 我想编写一个bash脚本,以将其动态转换为HTML表field,displayName并type作为标题。 将Csv2HtmlConverter.sh(通过在回答灵感转换CSV HTML表格使用到)是 echo "<table>" ; while read INPUT ; do echo "<tr><td>${INPUT//,/</td><td>}</td></tr>" ; done < Medical.csv ; echo "</table>" 对于上面的脚本的结果如下这是罚款,在一定程度上,但我想补充<th>field</th>,<th>displayName</th>动态。 <table> <tr><td>field: 'participation.type'</td><td> displayName: 'program_type'</td><td> type: 'String'</td><td>path:'participation'</td></tr> <tr><td>field: 'participation.program'</td><td> displayName: 'program_name'</td><td> type: 'String'</td><td>path:'participation'</td></tr> </table>

2
除了SeleniumRC之外,还有没有其他好的工具可以提取包含JavaScript后绘制内容的网页?
一个主要的缺点curl是,越来越多的网页的主要内容是由在初始HTTP响应之后发生的JavaScript AJAX响应绘制的。curl永远不会选择此后涂内容。 因此,为了从命令行获取这些类型的网页,我被简化为用Ruby编写脚本,这些脚本驱动SeleniumRC启动Firefox实例,然后在这些AJAX调用完成后返回源HTML。 对于此类问题,使用精简的命令行解决方案会更好。有人知道吗?
8 wget  http  html  curl  selenium 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.