Rust中的“肥胖指针”是什么?


91

我已经在多个上下文中阅读过“胖指针”一词,但是我不确定它的确切含义以及何时在Rust中使用它。该指针似乎是普通指针的两倍,但我不明白为什么。它也似乎与特征对象有关。


7
该术语本身不是特定于Rust的BTW。胖指针通常指的是一种指针,它除了存储所指向对象的地址外,还存储一些额外的数据。如果指针包含一些标记位,并且取决于那些标记位,则该指针有时根本不是指针,则称为标记指针表示。(例如,在许多Smalltalks VM上,以1位结尾的指针实际上是31/63位整​​数,因为指针是字对齐的,因此永远不会以1结尾。)HotSpot JVM将其胖指针称为OOP s(面向对象)指针)。
约尔格W¯¯米塔格

1
只是一个建议:当我发布问答集时,我通常会写一个小纸条,说明这是一个自回答的问题,以及为什么决定发布它。在这里查看问题的脚注:stackoverflow.com/q/46147231/5768908
Gerardo Furtado

@GerardoFurtado我最初在这里发表了评论,以解释这一点。但现在已将其删除(不是我删除的)。但是,是的,我同意,这样的注释通常很有用!
Lukas Kalbertodt

@
JörgW

Answers:


102

术语“胖指针”用于表示对动态大小类型(DST)–切片或特征对象的引用和原始指针。粗大的指针包含一个指针以及一些使DST“完成”的信息(例如,长度)。

Rust中最常用的类型不是DST,而是在编译时已知的固定大小。这些类型实现Sized特质。甚至管理动态大小的堆缓冲区的类型(例如Vec<T>),Sized因为编译器都知道Vec<T>实例将在堆栈上占用的确切字节数。目前,Rust中有四种不同的DST。


切片([T]str

类型[T](适用于任何类型T)是动态调整大小的(特殊的“字符串切片”类型也是如此str)。这就是为什么您通常只将其视为&[T]&mut [T],即在引用后面。该参考是所谓的“胖指针”。让我们检查:

dbg!(size_of::<&u32>());
dbg!(size_of::<&[u32; 2]>());
dbg!(size_of::<&[u32]>());

打印(进行一些清理):

size_of::<&u32>()      = 8
size_of::<&[u32; 2]>() = 8
size_of::<&[u32]>()    = 16

因此,我们看到对普通类型u32的引用(如对array的引用)的长度为8个字节[u32; 2]。这两种类型不是DST。但是与[u32]DST一样,对其的引用也要大一倍。对于切片,“完成” DST的其他数据就是长度。因此,可以说的表示形式&[u32]是这样的:

struct SliceRef { 
    ptr: *const u32, 
    len: usize,
}

特质对象(dyn Trait

当使用特征作为特征对象(即类型被擦除,动态调度)时,这些特征对象就是DST。例:

trait Animal {
    fn speak(&self);
}

struct Cat;
impl Animal for Cat {
    fn speak(&self) {
        println!("meow");
    }
}

dbg!(size_of::<&Cat>());
dbg!(size_of::<&dyn Animal>());

打印(进行一些清理):

size_of::<&Cat>()        = 8
size_of::<&dyn Animal>() = 16

同样,&Cat由于Cat是普通类型,因此只有8个字节大。但是dyn Animal是特征对象,因此具有动态大小。因此,&dyn Animal是16个字节大。

对于特征对象,完成DST的其他数据是指向vtable(vptr)的指针。我在这里无法完全解释vtables和vptrs的概念,但是它们用于在此虚拟调度上下文中调用正确的方法实现。vtable是静态数据,基本上每个方法只包含一个函数指针。这样,对特征对象的引用基本上表示为:

struct TraitObjectRef {
    data_ptr: *const (),
    vptr: *const (),
}

(这与C ++不同,在C ++中,抽象类的vptr存储在对象中。这两种方法都有其优点和缺点。)


自定义DST

实际上,可以通过具有最后一个字段为DST的结构来创建自己的DST。不过,这种情况很少见。一个突出的例子是std::path::Path

指向自定义DST的引用或指针也是胖指针。附加数据取决于结构内部DST的类型。


例外:外部类型

RFC 1861中extern type引入了该功能。外部类型也是DST,但是指向它们的指针不是胖指针。或更确切地说,如RFC所述:

在Rust中,指向DST的指针携带有关所指向对象的元数据。对于字符串和切片,这是缓冲区的长度,对于特征对象,这是对象的vtable。对于外部类型,元数据很简单()。这意味着指向extern类型的指针具有与a相同的大小usize(即,它不是“胖指针”)。

但是,如果您不与C接口交互,则可能永远不必处理这些外部类型。




上面,我们已经看到了不可变引用的大小。胖指针对可变引用,不变的原始指针和可变的原始指针的作用相同:

size_of::<&[u32]>()       = 16
size_of::<&mut [u32]>()   = 16
size_of::<*const [u32]>() = 16
size_of::<*mut [u32]>()   = 16
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.