it-swarm.dev

Vynutit XDocument zapsat na řetězec s kódováním UTF-8

Chci být schopen psát XML do Stringu s deklarací as kódováním UTF-8. To se zdá být moc složité dosáhnout.

Četl jsem si trochu a vyzkoušel některé z populárních odpovědí, ale všechny mají problémy. Můj aktuální kód správně vystupuje jako UTF-8, ale neudržuje původní formátování XDocumentu (tj. Odsazení/mezery)!

Může někdo nabídnout nějakou radu, prosím?

XDocument xml = new XDocument(new XDeclaration("1.0", "utf-8", "yes"), xelementXML);

MemoryStream ms = new MemoryStream();
using (XmlWriter xw = new XmlTextWriter(ms, Encoding.UTF8))
{
  xml.Save(xw);
  xw.Flush();

  StreamReader sr = new StreamReader(ms);
  ms.Seek(0, SeekOrigin.Begin);

  String xmlString = sr.ReadToEnd();
}

XML vyžaduje, aby formátování bylo totožné s formátem .ToString(), který by jej formátoval, tzn.

<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<root>
  <node>blah</node>
</root>

To, co vidím, je

<?xml version="1.0" encoding="utf-8" standalone="yes"?><root><node>blah</node></root>

Update Podařilo se mi to dostat do práce přidáním XmlTextWriter nastavení ... Zdá se, že velmi neohrabaný ačkoli!

MemoryStream ms = new MemoryStream();
XmlWriterSettings settings = new XmlWriterSettings();
settings.Encoding = Encoding.UTF8;
settings.ConformanceLevel = ConformanceLevel.Document;
settings.Indent = true;
using (XmlWriter xw = XmlTextWriter.Create(ms, settings))
{
  xml.Save(xw);
  xw.Flush();

  StreamReader sr = new StreamReader(ms);
  ms.Seek(0, SeekOrigin.Begin);
  String blah = sr.ReadToEnd();
}
34
Chris

Zkuste to:

using System;
using System.IO;
using System.Text;
using System.Xml.Linq;

class Test
{
  static void Main()
  {
    XDocument doc = XDocument.Load("test.xml",
                    LoadOptions.PreserveWhitespace);
    doc.Declaration = new XDeclaration("1.0", "utf-8", null);
    StringWriter writer = new Utf8StringWriter();
    doc.Save(writer, SaveOptions.None);
    Console.WriteLine(writer);
  }

  private class Utf8StringWriter : StringWriter
  {
    public override Encoding Encoding { get { return Encoding.UTF8; } }
  }
}

Samozřejmě, neprokázali jste nám, jak dokument vytváříte, což ztěžuje otestovat ... Zkoušel jsem to s ručně konstruovanou XDocument a která obsahuje také příslušné mezery.

58
Jon Skeet

Zkuste XmlWriterSettings:

XmlWriterSettings xws = new XmlWriterSettings();
xws.OmitXmlDeclaration = false;
xws.Indent = true;

A předejte to dál

using (XmlWriter xw = XmlWriter.Create(sb, xws))
1
KMån

Viz také https://stackoverflow.com/a/3288376/1430535

return xdoc.Declaration.ToString() + Environment.NewLine + xdoc.ToString();
0
Polluks