it-swarm.dev

Force o XDocument a gravar em String com codificação UTF-8

Eu quero ser capaz de escrever XML para um String com a declaração e com codificação UTF-8. Isso parece muito difícil de realizar.

Eu li um pouco e tentei algumas das respostas populares para isso, mas todos eles têm problemas. Meu código atual gera corretamente como UTF-8, mas não mantém a formatação original do XDocument (ou seja, recuos/espaços em branco)!

Alguém pode oferecer algum conselho, por favor?

XDocument xml = new XDocument(new XDeclaration("1.0", "utf-8", "yes"), xelementXML);

MemoryStream ms = new MemoryStream();
using (XmlWriter xw = new XmlTextWriter(ms, Encoding.UTF8))
{
    xml.Save(xw);
    xw.Flush();

    StreamReader sr = new StreamReader(ms);
    ms.Seek(0, SeekOrigin.Begin);

    String xmlString = sr.ReadToEnd();
}

O XML requer que a formatação seja idêntica à maneira como a .ToString() formata, ou seja,.

<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<root>
    <node>blah</node>
</root>

O que estou vendo atualmente é

<?xml version="1.0" encoding="utf-8" standalone="yes"?><root><node>blah</node></root>

Update Consegui fazer isso funcionar adicionando configurações XmlTextWriter ... Parece muito desajeitado!

MemoryStream ms = new MemoryStream();
XmlWriterSettings settings = new XmlWriterSettings();
settings.Encoding = Encoding.UTF8;
settings.ConformanceLevel = ConformanceLevel.Document;
settings.Indent = true;
using (XmlWriter xw = XmlTextWriter.Create(ms, settings))
{
    xml.Save(xw);
    xw.Flush();

    StreamReader sr = new StreamReader(ms);
    ms.Seek(0, SeekOrigin.Begin);
    String blah = sr.ReadToEnd();
}
34
Chris

Tente isto:

using System;
using System.IO;
using System.Text;
using System.Xml.Linq;

class Test
{
    static void Main()
    {
        XDocument doc = XDocument.Load("test.xml",
                                       LoadOptions.PreserveWhitespace);
        doc.Declaration = new XDeclaration("1.0", "utf-8", null);
        StringWriter writer = new Utf8StringWriter();
        doc.Save(writer, SaveOptions.None);
        Console.WriteLine(writer);
    }

    private class Utf8StringWriter : StringWriter
    {
        public override Encoding Encoding { get { return Encoding.UTF8; } }
    }
}

Claro, você não nos mostrou como está construindo o documento, o que dificulta o teste ... Acabei de tentar com uma XDocument construída à mão e que também contém o espaço em branco relevante.

58
Jon Skeet

Tente XmlWriterSettings:

XmlWriterSettings xws = new XmlWriterSettings();
xws.OmitXmlDeclaration = false;
xws.Indent = true;

E passá-lo como

using (XmlWriter xw = XmlWriter.Create(sb, xws))
1
KMån

Veja também https://stackoverflow.com/a/3288376/1430535

return xdoc.Declaration.ToString() + Environment.NewLine + xdoc.ToString();
0
Polluks