实现HTML的简单压缩

PageReleaser需要一种HTML的压缩算法,Google了很久,发现如果只是简单去除空白和注释的话,使用XLinq就可以轻易的实现

先看看MSDN是怎么说的:

一种常用方案是读取缩进的 XML,在内存中创建一个没有任何空白文本节点(即不保留空白)的 XML 树,对该 XML 执行某些操作,然后保存带缩进的 XML。在序列化带格式的 XML 时,只保留 XML 树中有意义的空白。这是[……]

more

集成Html Tidy

解析HTML最大的问题是不能使用标准的XML解析器,虽然很多新的网站开始逐步改用规范的XHTML,但只有出现一个<br>就会导致整个解析过程的失败,而好的HTML解析器却不是那么容易找到的,所以转换或许也是一个很好的选项

在google这个问题的时候,发现一个好东西HTML Tidy,W3C出品的,开源的小工具,可以将HTML转换成XHTML或XML

HTML Tidy提供了编译好[……]

more

C#中使用Xslt 2.0处理器

用C#处理Xslt 2.0的时候,才发现原来.Net并没有提供对Xslt 2.0的支持,毕竟Xslt 2.0目前更多的还是纸面上的标准,而且微软的动作一向速度有限。

于是开始找专门的Xslt 2.0处理器。

首先找到的是Saxon,不知道是不是逐步商业化的缘故,Saxon版本显得有点凌乱。在9.1,分成商用的SA版,开源的B版;到了9.2又改成商用的EE企业版,PE专业版和开源的HE家庭版,加[……]

more