pyyaml:不带标签的转储


71

我有

>>> import yaml
>>> yaml.dump(u'abc')
"!!python/unicode 'abc'\n"

但是我想要

>>> import yaml
>>> yaml.dump(u'abc', magic='something')
'abc\n'

什么魔术参数强制不加标签?

Answers:


93

您可以使用safe_dump代替dump。请记住,那时它将无法表示任意Python对象。另外,当您load使用YAML时,将获得一个str对象,而不是unicode


safe_dump似乎在最后强制了一个“ ...”,但这很容易解决
Paul Tarjan 2009年

@ATOzTOA我不确定您要问的是什么,但是也有safe_dump_all
interjay

@interjay是的,对。我试过了,但是我有一个对象,而不是字符串。说得通。
ATOzTOA

19

这个怎么样:

def unicode_representer(dumper, uni):
    node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni)
    return node

yaml.add_representer(unicode, unicode_representer)

对于我来说,这似乎使转储unicode对象的工作与转储str对象的工作相同(Python 2.6)。

In [72]: yaml.dump(u'abc')
Out[72]: 'abc\n...\n'

In [73]: yaml.dump('abc')
Out[73]: 'abc\n...\n'

In [75]: yaml.dump(['abc'])
Out[75]: '[abc]\n'

In [76]: yaml.dump([u'abc'])
Out[76]: '[abc]\n'

1
这适用于基本情况,但在某些情况下会弄乱数据。另外,您应该在答案中提到函数是yaml在对象上而不是对象上调用的。
ATOzTOA

4

您需要一个新的dumper类,该类可以执行标准Dumper类所做的所有工作,但会覆盖str和unicode的表示形式。

from yaml.dumper import Dumper
from yaml.representer import SafeRepresenter

class KludgeDumper(Dumper):
   pass

KludgeDumper.add_representer(str,
       SafeRepresenter.represent_str)

KludgeDumper.add_representer(unicode,
        SafeRepresenter.represent_unicode)

这导致

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper)
[abc, "abc\xE7"]

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None)
[abc, "abc\xE7"]

当然,我仍然对如何保持这种美观感到困惑。

>>> print u'abc\xe7'
abcç

它破坏了以后的yaml.load()

>>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None))
>>> yy
['abc', 'abc\xe7']
>>> print yy[1]
abc�
>>> print u'abc\xe7'
abcç

2

除了interjay的出色回答之外,如果您照顾好文件编码,则可以使unicode重新加载。

# -*- coding: utf-8 -*-
import yaml
import codecs

data = dict(key = u"abcç\U0001F511")

fn = "test2.yaml"
with codecs.open(fn, "w", encoding="utf-8") as fo:
    yaml.safe_dump(data, fo)

with codecs.open(fn, encoding="utf-8") as fi:
    data2 = yaml.safe_load(fi)

print ("data2:", data2, "type(data.key):", type(data2.get("key")) )

print data2.get("key")

我的编辑器中的test2.yaml内容:

{key: "abc\xE7\uD83D\uDD11"}

打印输出:

('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>) abcç🔑

另外,在阅读http://nedbatchelder.com/blog/201302/war_is_peace.html之后,我很确定safe_load / safe_dump仍然是我想要的地方。


0

我刚刚开始使用Python和YAML,但这可能也有帮助。只需比较输出:

def test_dump(self):
    print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True)
    print yaml.dump_all([{'name': 'value'}, {'name2': 1}])
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.