又上了名字空间的套

Posted on 2010/01/25 by 书剑生活

在做一个XML的XSL，原XML如下：

<?xml version="1.0" encoding="utf-16"?>
<book version="5.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xi="http[……]

more

实现HTML的简单压缩

Posted on 2009/12/21 by 书剑生活

PageReleaser需要一种HTML的压缩算法，Google了很久，发现如果只是简单去除空白和注释的话，使用XLinq就可以轻易的实现

先看看MSDN是怎么说的：

一种常用方案是读取缩进的 XML，在内存中创建一个没有任何空白文本节点（即不保留空白）的 XML 树，对该 XML 执行某些操作，然后保存带缩进的 XML。在序列化带格式的 XML 时，只保留 XML 树中有意义的空白。这是[……]

more

Posted on 2009/10/28 by 书剑生活

解析HTML最大的问题是不能使用标准的XML解析器，虽然很多新的网站开始逐步改用规范的XHTML，但只有出现一个<br>就会导致整个解析过程的失败，而好的HTML解析器却不是那么容易找到的，所以转换或许也是一个很好的选项

在google这个问题的时候，发现一个好东西HTML Tidy，W3C出品的，开源的小工具，可以将HTML转换成XHTML或XML

HTML Tidy提供了编译好[……]

Posted on 2009/10/14 by 书剑生活

用C#处理Xslt 2.0的时候，才发现原来.Net并没有提供对Xslt 2.0的支持，毕竟Xslt 2.0目前更多的还是纸面上的标准，而且微软的动作一向速度有限。

于是开始找专门的Xslt 2.0处理器。

首先找到的是Saxon，不知道是不是逐步商业化的缘故，Saxon版本显得有点凌乱。在9.1，分成商用的SA版，开源的B版；到了9.2又改成商用的EE企业版，PE专业版和开源的HE家庭版，加[……]