往返于数据的Swift数字类型


94

使用Swift 3 Data而不是[UInt8],我试图找出最有效/惯用的编码/解码方式,将各种数字类型(UInt8,Double,Float,Int64等)转换为Data对象。

这个答案使用[UINT8] ,但它似乎是使用各种指针的API,我不能对数据找到。

我基本上想要一些自定义扩展,如下所示:

let input = 42.13 // implicit Double
let bytes = input.data
let roundtrip = bytes.to(Double) // --> 42.13

我仔细阅读了许多文档,真正使我难以理解的部分是如何从任何基本结构(所有数字都是)中获得某种指针(OpaquePointer或BufferPointer或UnsafePointer?)。在C语言中,我只需在它前面拍一个&符,然后就可以了。


Answers:


256

注意:该代码现已针对Swift 5(Xcode 10.2)更新。(可以在编辑历史记录中找到Swift 3和Swift 4.2版本。)现在,可能还可以正确处理未对齐的数据。

如何Data从价值中创造

从Swift 4.2开始,可以使用

let value = 42.13
let data = withUnsafeBytes(of: value) { Data($0) }

print(data as NSData) // <713d0ad7 a3104540>

说明:

  • withUnsafeBytes(of: value) 使用覆盖该值原始字节的缓冲区指针来调用闭包。
  • 原始缓冲区指针是字节序列,因此Data($0)可以用来创建数据。

如何从中检索值 Data

从Swift 5开始,withUnsafeBytes(_:)of会Data使用UnsafeMutableRawBufferPointer对字节的“未类型化”调用闭包。该load(fromByteOffset:as:)方法从内存中读取值:

let data = Data([0x71, 0x3d, 0x0a, 0xd7, 0xa3, 0x10, 0x45, 0x40])
let value = data.withUnsafeBytes {
    $0.load(as: Double.self)
}
print(value) // 42.13

这种方法有一个问题:它要求内存针对该类型进行属性对齐(此处:对齐8字节地址)。但这不能保证,例如,如果数据是作为另一个Data值的切片获得的。

因此,字节复制到以下值更安全:

let data = Data([0x71, 0x3d, 0x0a, 0xd7, 0xa3, 0x10, 0x45, 0x40])
var value = 0.0
let bytesCopied = withUnsafeMutableBytes(of: &value, { data.copyBytes(to: $0)} )
assert(bytesCopied == MemoryLayout.size(ofValue: value))
print(value) // 42.13

说明:

返回值copyBytes()是复制的字节数。它等于目标缓冲区的大小,如果数据不包含足够的字节,则小于此大小。

通用解决方案#1

上面的转换现在可以很容易地实现为以下通用方法struct Data

extension Data {

    init<T>(from value: T) {
        self = Swift.withUnsafeBytes(of: value) { Data($0) }
    }

    func to<T>(type: T.Type) -> T? where T: ExpressibleByIntegerLiteral {
        var value: T = 0
        guard count >= MemoryLayout.size(ofValue: value) else { return nil }
        _ = Swift.withUnsafeMutableBytes(of: &value, { copyBytes(to: $0)} )
        return value
    }
}

T: ExpressibleByIntegerLiteral此处添加了约束,以便我们可以轻松地将值初始化为“零” –这并不是真正的限制,因为无论如何该方法都可以与“特制”(整数和浮点)类型一起使用,请参见下文。

例:

let value = 42.13 // implicit Double
let data = Data(from: value)
print(data as NSData) // <713d0ad7 a3104540>

if let roundtrip = data.to(type: Double.self) {
    print(roundtrip) // 42.13
} else {
    print("not enough data")
}

同样,您可以在数组之间Data来回转换:

extension Data {

    init<T>(fromArray values: [T]) {
        self = values.withUnsafeBytes { Data($0) }
    }

    func toArray<T>(type: T.Type) -> [T] where T: ExpressibleByIntegerLiteral {
        var array = Array<T>(repeating: 0, count: self.count/MemoryLayout<T>.stride)
        _ = array.withUnsafeMutableBytes { copyBytes(to: $0) }
        return array
    }
}

例:

let value: [Int16] = [1, Int16.max, Int16.min]
let data = Data(fromArray: value)
print(data as NSData) // <0100ff7f 0080>

let roundtrip = data.toArray(type: Int16.self)
print(roundtrip) // [1, 32767, -32768]

通用解决方案#2

上面的方法有一个缺点:它实际上仅适用于“平凡”类型,例如整数和浮点类型。“复杂”类型像ArrayString具有指向基础存储的(隐藏)指针,并且不能仅通过复制结构本身来传递。它也不适用于引用类型,引用类型只是指向实际对象存储的指针。

所以解决这个问题,可以

  • 定义一个协议,该协议定义了Data往返转换的方法:

    protocol DataConvertible {
        init?(data: Data)
        var data: Data { get }
    }
  • 在协议扩展中将转换实现为默认方法:

    extension DataConvertible where Self: ExpressibleByIntegerLiteral{
    
        init?(data: Data) {
            var value: Self = 0
            guard data.count == MemoryLayout.size(ofValue: value) else { return nil }
            _ = withUnsafeMutableBytes(of: &value, { data.copyBytes(to: $0)} )
            self = value
        }
    
        var data: Data {
            return withUnsafeBytes(of: self) { Data($0) }
        }
    }

    我在这里选择了一个失败的初始化程序,该初始化程序检查提供的字节数是否与类型的大小匹配。

  • 最后声明对所有可以安全转换的类型的一致性Data

    extension Int : DataConvertible { }
    extension Float : DataConvertible { }
    extension Double : DataConvertible { }
    // add more types here ...

这使转换更加优雅:

let value = 42.13
let data = value.data
print(data as NSData) // <713d0ad7 a3104540>

if let roundtrip = Double(data: data) {
    print(roundtrip) // 42.13
}

第二种方法的优点是您不会无意间进行不安全的转换。缺点是您必须明确列出所有“安全”类型。

您还可以为需要非平凡转换的其他类型实现协议,例如:

extension String: DataConvertible {
    init?(data: Data) {
        self.init(data: data, encoding: .utf8)
    }
    var data: Data {
        // Note: a conversion to UTF-8 cannot fail.
        return Data(self.utf8)
    }
}

或以自己的类型实现转换方法以执行所需的任何操作,以便对值进行序列化和反序列化。

字节顺序

在上述方法中,没有字节顺序转换,数据始终以主机字节顺序进行。对于独立于平台的表示(例如“大端”或“网络”字节顺序),请使用相应的整数属性。初始化程序。例如:

let value = 1000
let data = value.bigEndian.data
print(data as NSData) // <00000000 000003e8>

if let roundtrip = Int(data: data) {
    print(Int(bigEndian: roundtrip)) // 1000
}

当然,这种转换通常也可以用通用转换方法来完成。


我们必须var复制初始值的事实是否意味着我们将字节复制了两次?在当前的用例中,我将它们转换为Data结构,因此可以将append它们转换为不断增长的字节流。在直线C中,这和一样容易*(cPointer + offset) = originalValue。因此,字节仅被复制一次。
特拉维斯·格里格斯

1
@TravisGriggs:复制一个int或float可能不相关,但是您可以在Swift中做类似的事情。如果您有一个,ptr: UnsafeMutablePointer<UInt8>则可以通过类似于UnsafeMutablePointer<T>(ptr + offset).pointee = value您的Swift代码的某种方式将其分配给引用的内存。存在一个潜在的问题:某些处理器仅允许对齐的内存访问,例如,您不能将Int存储在奇数个内存位置。我不知道这是否适用于当前使用的Intel和ARM处理器。
马丁R

1
@TravisGriggs:(续)...此外,这还要求已经创建了足够大的Data对象,在Swift中,您只能创建和初始化 Data对象,因此在初始化。–如果您需要更多详细信息,那么我建议您发布一个新问题。
马丁·R

2
@HansBrende:恐怕目前不可能。这将需要一个extension Array: DataConvertible where Element: DataConvertible。在Swift 3中这是不可能的,但据我所知,它计划在Swift 4中进行。在github.com/apple/swift/blob/master/docs/…中
Martin R

1
@m_katsifarakis:可能是您输错Int.selfInt.Type吗?
马丁R

3

您可以使用以下方法获得指向可变对象的不安全指针withUnsafePointer

withUnsafePointer(&input) { /* $0 is your pointer */ }

我不知道为不可变对象获取一个的方法,因为inout运算符仅适用于可变对象。

您所链接的答案中对此进行了证明。


2

就我而言,Martin R的回答有所帮助,但结果却相反。因此,我对他的代码做了一些小的更改:

extension UInt16 : DataConvertible {

    init?(data: Data) {
        guard data.count == MemoryLayout<UInt16>.size else { 
          return nil 
        }
    self = data.withUnsafeBytes { $0.pointee }
    }

    var data: Data {
         var value = CFSwapInt16HostToBig(self)//Acho que o padrao do IOS 'e LittleEndian, pois os bytes estavao ao contrario
         return Data(buffer: UnsafeBufferPointer(start: &value, count: 1))
    }
}

问题与LittleEndian和BigEndian有关。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.