当前位置: 首页>徒步 >

老生常谈:值类型 V.S. 引用类型

来源: 博客园 | 时间: 2023-06-29 09:31:37 |

我在面试的时候经常会问一个问题:“谈谈值类型和引用的区别”。对于这个问题,绝大部分人都只会给我两个简洁的答案:“值类型分配在栈中,引用类型分配在堆中”,“在默认情况下,值类型参数传值(拷贝),引用类型参数传引用”。其实这个问题有很大的发挥空间,如果能够从内存布局、GC、互操作、跨AppDomain传递等方面展开,相信会加分不少。这篇文章独辟蹊径,从“变量”的角度讨论值类型和引用类型的区别。


【资料图】

一、变量的地址二、变量的值三、常规参数的传递四、ref参数的传递五、in/out参数六、总结

一、变量的地址

CLR是一个纯粹基于“栈”的虚拟机,所以在IL层面总是采用“压栈”的方式来传递参数,所以不论是引用类型还是值类型的变量,其变量自身都是分配在栈上。而x86机器指令则是基于“栈+寄存器”,所以有些变量可能会最终存储在某个寄存器上,不过这不是这篇文章关注的问题。既然变量分配在栈上,那么它必然映射一个内存地址,指向该地址的指针可以采用如下这个AsPointer方法实现的方式提取出来。

不论是值类型还是引用类型,变量都是分配在栈(或者寄存器)上,所以每个变量具有一个内存地址,如下这个AsPointer方法通过调用Unsafe.AsPointer方法得到指定变量的指针(void*),然后将其转换成IntPtr(nint)类型。

internal static class Utility{    public static unsafe nint AsPointer(ref T value) => new(Unsafe.AsPointer(ref value));}

在如下的演示程序中,我定义具有相同数据成员的两个类型,其中FoobarStruct为结构体,而FoobarClass为类。我们先后定义了四个变量s1、c1、s2和c2,其中s2和c2的值是由s1和c1赋予的。我们调用上面这个AsPointer方法将四个变量的内存地址打印出来。

var s1 = new FoobarStruct(255, 1);var c1 = new FoobarClass(255, 1);var s2 = s1;var c2 = c1;Console.WriteLine($"s1: {Utility.AsPointer(ref s1)}");Console.WriteLine($"c1: {Utility.AsPointer(ref c1)}");Console.WriteLine($"s2: {Utility.AsPointer(ref s2)}");Console.WriteLine($"c2: {Utility.AsPointer(ref c2)}");public class FoobarClass{    public byte Foo { get; set; }    public long Bar { get; set; }    public FoobarClass(byte foo, long bar)    {        Foo = foo;        Bar = bar;    }}public struct FoobarStruct{    public byte Foo { get; set; }    public long Bar { get; set; }    public FoobarStruct(byte foo, long bar)    {        Foo = foo;        Bar = bar;    }}

如下所示的是程序运行后控制台上的输出结果。可以看出虽然s1和s2、c1和c2虽然具有相同的“值”,但是变量本身具有独立的内存地址。我们可以进一步看出四个变量的地址是“递减的”,这印证了一句话“栈往下生长、堆往上生长”。

二、变量的“值”

对上面演示的这个例子来说,由于s1、c1、 s2和c2是依次定义的,所以它们对应的内存是连续的。不仅如此,我们还可以根据输出的地址计算出四个变量所占的内存大小。具体的布局如下,两个值类型的变量s1和s2占据16个字节,而两个引用类型的变量c1和c2则只占据8个字节。变量

对于值类型来说,变量与其承载的内容是“一体”的,也就是说变量占据的内存存储的就是它承载的内容。也就是说s1和s2占据的16个字节存储的就是FoobarStruct这个结构体的荷载内容。那么问题又来了,FoobarStruct结构体包含的两个字段的类型分别是byte和long,对应的字节数分别是1和8,总字节数应该是9个字节才对,多出的7个字节是“内存地址对齐(Alignment)”造成的。由于要确保Bar字段基于8个字节的内存对齐,虽然Foo字段只需要使用一个字节,也需要添加7个空白字节。具体的内存布局请求参与相关的文档,在这里就不再赘述了。对于引用类型来说,变量与其承载的内容则是“分离”的。引用类型的实例分配在堆上,对应的地址存储在变量占据的栈内存上。x64机器使用8个字节表示内存地址,所以c1和c2这两个变量只占据8个字节就很容易理解了。

由于变量具有唯一的栈内存地址,其类型决定字节大小,所以一个变量可以确定一段连续的栈内存空间,我们在Utility类中定义了如下这个Read方法将这段内存空间的字节内容读取出来。如代码片段所示,我们通过调用Unsafe.SizeOf方法确定字节数量,并据此创建一个字节数组。通过上面定义的AsPointer方法得到变量的地址后,将其传入Marshal的Copy方法将字节内容拷贝到数组中。

internal static class Utility{    public static unsafe byte[] Read(ref T value)    {        byte[] bytes = new byte[Unsafe.SizeOf()];        Marshal.Copy(AsPointer(ref value), bytes, 0, bytes.Length);        return bytes;    }}

在如下所示的演示程序中,我们依然按照上面的方式定义了四个变量并对它们进行了赋值,这次我们选择调用上面这个Read方法将四个变量的字节内容以16进制的形式打印出来。

var s1 = new FoobarStruct(255, 1);var c1 = new FoobarClass(255, 1);var s2 = s1;var c2 = c1;Console.WriteLine($"s1: {BitConverter.ToString(Utility.Read(ref s1))}");Console.WriteLine($"c1: {BitConverter.ToString(Utility.Read(ref c1))}");Console.WriteLine($"s2: {BitConverter.ToString(Utility.Read(ref s2))}");Console.WriteLine($"c2: {BitConverter.ToString(Utility.Read(ref c2))}");

从如下所示的输出结果可以看出,s1与s2,以及c1和c2承载的字节内容是完全一致的。s1和s2存储的正好是FoobarStruct的两个字段的内容,而且我们还看到了byte类型的Foo字段因“内存对齐”添加的7个空白字节(FF-00-00-00-00-00-00-00)。

虽然c1和c2具有相同的字节内容,又如何确定它们就是我们创建的FoobarClass对象在堆上的内存地址呢?这也可以通过如下的程序来验证:我们创建了一个FoobarClass对象,并将其赋值给变量value。我们调用Read方法确定该变量承载的8个字节,并调用BinaryPrimitives的ReadInt64LittleEndian方法(x86采用小端字节序)转换成long类型,然后进一步转换成IntPtr(nint)类型。指向FoobarClass对象的指针可以通过调用Unsafe的AsPointer方法获得,我们通过“解指针”得到以IntPtr类型表示的内存地址。调式断言可以确认两个IntPtr对象的值是相等的。

unsafe{    var value = new FoobarClass(255, 1);    var bytes = Utility.Read(ref value);    var pointer1 = new nint(BinaryPrimitives.ReadInt64LittleEndian(bytes));    var pointer2 = *(nint*)Unsafe.AsPointer(ref value);    Debug.Assert(pointer1 == pointer2);}
三、常规参数的传递

对于值类型和引用类型在参数传递过程中的差异,如果我们了解了变量的本质,就很好理解了。两者直接的差异是“没有差异”——当我们将一个变量作为参数传递给某个方法时,传递的总是变量对应的栈内存存储的内容。对于值类型,传递的就是实例本身的内容;对于引用类型,传递的就是实例的地址。

var s = new FoobarStruct(255, 1);var c = new FoobarClass(255, 1);Invoke(s, c);Debug.Assert(s.Foo == 255);Debug.Assert(s.Bar == 1);Debug.Assert(c.Foo == 0);Debug.Assert(c.Bar == 0);static void Invoke(FoobarStruct args, FoobarClass argc){    args.Foo = 0;    args.Bar = 0;    argc.Foo = 0;    argc.Bar = 0;}

有了这个认识,对于如上这段代码表现出的针对两种类型参数传递的“差异”就不难理解了。如下面的代码片段所示,变量s、c以及Invoke方法的参数args和argc都被分配到栈内存上,虽然s与args,c与argc具有相同的内容,但是针对args的操作将不会对s造成影响,但是针对c和argc的操作最终作用在引用的FoobarClass对象上。

变量与参数具有不同的内存地址可以通过如下的程序来验证:我们定义了类型分别为FoobarStruct和FoobarClass的两个变量s和c,并将其内存地址打印出来。两个变量作为参数传入Invoke方法中,后者将参数的内存地址打印出来。

var s = new FoobarStruct(255, 1);var c = new FoobarClass(255, 1);Console.WriteLine($"s   : {Utility.AsPointer(ref s)}");Console.WriteLine($"c   : {Utility.AsPointer(ref c)}");Invoke(s, c);static void Invoke(FoobarStruct args, FoobarClass argc){    Console.WriteLine($"args: {Utility.AsPointer(ref args)}");    Console.WriteLine($"argc: {Utility.AsPointer(ref argc)}");}

输出结果如下,可以看出变量和对应的参数具有完全不同的内存地址。

四、ref参数的传递

我们都知道如果方法需要对原始值类型变量进行修改,就需要使用ref关键来修饰对应的参数。对于上面定义的Invoke方法,如果我们在FoobarStruct类型的参数args上添加了ref关键字,变量s表示的结构体就可以在这个方法中被修改了。

var s = new FoobarStruct(255, 1);var c = new FoobarClass(255, 1);Invoke(refs, refc);Debug.Assert(s.Foo == 0);Debug.Assert(s.Bar == 0);Debug.Assert(c.Foo == 0);Debug.Assert(c.Bar == 0);static void Invoke(refFoobarStruct args, refFoobarClass argc){    args.Foo = 0;    args.Bar = 0;    argc.Foo = 0;    argc.Bar = 0;}

对于值类型ref参数的作用,几乎所有人都能够理解,但是我发现很多人理解不了引用类型的ref参数。在他们眼中,引用类型的参数传递的就是对象的引用,加上ref关键有什么意义呢?值类型和引用类型的ref参数究竟有什么区别呢?答案同样是“没有区别”,因为它们传递的就是变量自身的地址罢了(如下所示)。

由于值类型变量和承载内容的“同一性”,所以我们自然可以利用ref参数修改变量承载的实例;引用类型存储的是对象的内存地址,那么我们不仅仅可以通过ref参数修改目标对象,我们还可以按照如下的方式让变量指向另一个对象。当然值类型ref参数也可以采用相同指定一个全新的值赋予变量。

var c = new FoobarClass(255, 1);var original = c;Invoke(ref c);Debug.Assert(!ReferenceEquals(original, c));Debug.Assert(c.Foo == 0);Debug.Assert(c.Bar == 0);static void Invoke(ref FoobarClass argc){    argc = new FoobarClass(0, 0);}

变量和对应的ref参数具有相同的内存地址,这可以通过如下这段程序来证明。

var s = new FoobarStruct(255, 1);var c = new FoobarClass(255, 1);Console.WriteLine($"s   : {Utility.AsPointer(ref s)}");Console.WriteLine($"c   : {Utility.AsPointer(ref c)}");Invoke(ref s, ref c);static void Invoke(ref FoobarStruct args, ref FoobarClass argc){    Console.WriteLine($"args: {Utility.AsPointer(ref args)}");    Console.WriteLine($"argc: {Utility.AsPointer(ref argc)}");}

输出结果:

值得一提的是,如果我们在方法(比如下面的Invoke1)中将ref参数直接赋值给另一个变量,此时又出现了拷贝。如果希望让ref参数和变量指向相同的内存地址,需要按照Invoke2方法那样同时在变量和参数上添加ref关键字。

var s = new FoobarStruct(255, 1);Invoke1(ref s);Debug.Assert(s.Foo == 255);Debug.Assert(s.Bar == 1);Invoke2(ref s);Debug.Assert(s.Foo == 0);Debug.Assert(s.Bar == 0);static void Invoke1(ref FoobarStruct args){    var s = args;s.Foo = 0;    s.Bar = 0;}static void Invoke2(ref FoobarStruct args){    ref var s = ref args;s.Foo = 0;    s.Bar = 0;}
五、in/out参数

由于ref参数赋予了方法“替换”原始变量的权力,这往往不是调用者希望的,此时就可以使用in关键字。in参数和ref参数在传递变量地址这方面是完全一致的,所以方法可以利用in参数修改原始变量的成员,但是类似于下面这总直接替换变量的行为是不支持的,将一个in参数以ref参数的形式赋值给一个ref变量也是不允许的。通过out关键字定义的输出参数和in/ref参数一样也是传递变量地址,也正是因为这样,方法才能通过参数赋值的方式将其传递给调用者。

static void Invoke1(in FoobarStruct args){ args = new FoobarStruct(0, 0);}static void Invoke2(in FoobarStruct args){ ref var s = ref args;

}

in/ref参数赋予了被调用方法直接修改或者替换原始变量的能力,那么如果我们没有这方面的需求,in/ref参数是否就无用武之地了呢?当然不是,in/ref参数可以避免针对值类型对象的拷贝,如果我们定义了一个较大的结构体,针对该结构体的参数传递将会导致大量的字节拷贝,如果我们使用in/ref参数,传递的字节总是固定的4个(x86)或者8个字节。

我们从IL代码的角度进一步探索常规参数传递和三种基于引用的参数传递,为此我们定义了如下这段简单的程序。如代码片段所示,Invoke方法定义了6个参数,arg、inArg和refArg分别为常规参数、in参数和ref参数,我们将它们赋值给三个对应的out参数。

var (arg1, arg2, arg3) = (1,1,1);Invoke(arg1, in arg2, ref arg3, out var outArg1, out var outArg2, out var outArg3);static void Invoke(int arg, in int inArg, ref int refArg, out int outArg1, out int outArg2, out int outArg3){    outArg1 = arg;    outArg2 = inArg;    outArg3 = refArg;}

如下所示的是Invoke方法对应的IL代码。看出虽然6个参数在C#中的类型都是Int32,但是标注了in/ref/out关键子的参数类型在IL中变成了int32&。由于inArg和refArg存储的是变量的地址,所以在利用ldarg.{index}指令将对应参数压入栈后,还需要进一步执行ldind.i4指令提取具体的值。

.method assembly hidebysig staticvoid "<
$>g__Invoke|0_0" (int32arg,[in] int32&inArg,int32&refArg,[out] int32&outArg1,[out] int32&outArg2,[out] int32&outArg3) cil managed{.custom instance void [System.Runtime]System.Runtime.CompilerServices.CompilerGeneratedAttribute::.ctor() = (01 00 00 00).param [2].custom instance void [System.Runtime]System.Runtime.CompilerServices.IsReadOnlyAttribute::.ctor() = (01 00 00 00)// Method begins at RVA 0x269e// Header size: 1// Code size: 15 (0xf).maxstack 8// {IL_0000: nop// outArg1 = arg;IL_0001: ldarg.3IL_0002: ldarg.0IL_0003: stind.i4// outArg2 = inArg;IL_0004: ldarg.s outArg2IL_0006: ldarg.1IL_0007: ldind.i4IL_0008: stind.i4// outArg3 = refArg;IL_0009: ldarg.s outArg3IL_000b: ldarg.2IL_000c: ldind.i4IL_000d: stind.i4// }IL_000e: ret} // end of method Program::"<
$>g__Invoke|0_0"

如下所示的IL代码体现了针对Invoke方法的调用。在对传入参数进行压栈过程中,对于第一个常规参数arg,会执行ldloc.{index}加载变量的值。至于其余5个基于引用/地址的参数,则需要执行ldloca.{index}加载变量的地址。

.method private hidebysig staticvoid "
$" (string[] args) cil managed{// Method begins at RVA 0x2670// Header size: 12// Code size: 25 (0x19).maxstack 6.entrypoint.locals init ([0] int32 arg1,[1] int32 arg2,[2] int32 arg3,[3] int32 outArg1,[4] int32 outArg2,[5] int32 outArg3)// int arg2 = 1;IL_0000: ldc.i4.1IL_0001: stloc.0// int inArg2 = 1;IL_0002: ldc.i4.1IL_0003: stloc.1// int refArg2 = 1;IL_0004: ldc.i4.1IL_0005: stloc.2// Invoke(arg2, in inArg2, ref refArg2, out var _, out var _, out var _);IL_0006: ldloc.0IL_0007: ldloca.s 1IL_0009: ldloca.s 2IL_000b: ldloca.s 3IL_000d: ldloca.s 4IL_000f: ldloca.s 5IL_0011: call void Program::"<
$>g__Invoke|0_0"(int32, int32&, int32&, int32&, int32&, int32&)// (no C# code)IL_0016: nop// }IL_0017: nopIL_0018: ret} // end of method Program::"
$"
六、总结

我们最后通过一个简单的类比来做一个总结。变量的目的在于传递信息,假设我们现在利用一个“盒子”来传递一幅世界名画,这个盒子就是变量,对于非引用性质的传递(作为方法参数,或者赋值给另一个变量),传递的都是盒子承载内容的拷贝。

如果是值类型,我们相当于我们将这幅画作“真迹”放到盒子中,所以传递的是这副画作的复制品,我们在复制品上所作的任何涂鸦自然不会对真迹造成影响。如果是引用类型,我们相当于将真迹存放到保险柜中,将保险柜的编号放到盒子中,那么我们每次从盒子中取出来的是这个编号的复制品,但是系统会自动根据这个编号从所在保险柜中的真迹供你欣赏,如果你想涂鸦的话,就真的毁了这副名画。

如果采用基于引用的传递(使用in/ref/out参数,或者针对ref 变量的赋值),相当于我们直接得到了这个盒子。对于值类型,意味着我们得到的也是真迹。不仅如此,我们还可以直接利用一副伪作将其掉包了。如果是值类型,相当于我们将盒子中的真迹换成了赝品。对于引用类型,我们先将赝品放在另一个保险柜中,将盒子中编号替换成这个保险柜的编号。

关键词:

 

热文推荐

老生常谈:值类型 V.S. 引用类型

我在面试的时候经常会问一个问题:“谈谈值类型和引用的区别”。对于这

2023-06-29

康熙之后是什么皇帝(康熙之后是谁继位)

来为大家解答以上问题。康熙之后是什么皇帝,康熙之后是谁继位这个很多

2023-06-29

何猷君是赌王几太生的(何猷君)

来为大家解答以下的问题,猷君是赌王几太生的,何猷君这个很多人还不知

2023-06-29

华光新材(688379)6月28日主力资金净买入179.25万元

截至2023年6月28日收盘,华光新材(688379)报收于19 37元,上涨2 32%,

2023-06-29

致力提供全方位绿色环保解决方案 天元智能6月29日上交所首发上会 焦点播报

据上交所网站消息,上交所上市审核委员会定于2023年6月29日召开2023年

2023-06-29

世界讯息:赵薇苏有朋新电影 赵薇版花木兰评分飙升

hello大家好,我是大学网网小航来为大家解答以上问题,赵薇苏有朋新电

2023-06-29

【全球速看料】牛散风云录:陈发树“惨亏”20亿,葛卫东败北,二季度最强牛散竟是他!

二季度即将过去,在市场整体走弱的背景下,牛散江湖也出现了巨震。

2023-06-29

治“气”久久为功 青年持续接力_天天亮点

生态环境部环境规划院大气环境规划研究所助理研究员冯悦怡已经在所里工

2023-06-29

全球短讯!北京鼓楼:明天起,延长开放时间调整至19:00

从6月30日(周五)起,北京鼓楼延长开放时间调整至19:00,18:30停止售票。

2023-06-29

新动态:疑似三星折叠屏新机通过相关认证,或于下月发布

作为目前三星旗下市场定位不同的两个折叠屏手机产品序列,GalaxyZFold

2023-06-29

深圳医保咨询电话人工服务电话(深圳市劳动局咨询电话)_天天快看点

1、深圳市劳动和社会保障局地址:深圳市深南中路1025号新城大厦东座邮

2023-06-29

要闻:小米mixalpha评测

小米MIXAlpha是一款小米于2019年发布的环幕屏概念手机,具有以下特点和

2023-06-29

剑与远征兑换码12.21 剑与远征兑换码5月最新 全球通讯

剑与远征12 21兑换码是什么?在今天,剑与远征又为玩家们送上神秘代码

2023-06-29

习近平向“鼓岭缘”中美民间友好论坛致贺信

新华社北京6月28日电6月28日,国家主席习近平向“鼓岭缘”中美民间友好

2023-06-29

未来如何❓罗克14球5助费用4500万⚔️16岁恩德里克6球1助7200万|焦点讯息

今天我们来横向对比一下两位巴西妖星前锋,出生于2005年2月现年18岁的

2023-06-29

喑哑的读音_喑-聚焦

1、喑yīn(1)(形声。2、从口,音声。3、本义:小儿哭泣不止)(2)同本义[cryceaselessl

2023-06-29

每日精选:[快讯]则成电子0万限售股7月6日解禁

CFi CN讯:则成电子(股票代码:837821)在2023年07月06日新增可售A股0

2023-06-29

人际关系图模板_人际关系图

1、没有什么软件是专门画这个的,不过这个图所有的绘图软件都可以画,

2023-06-29

光庭信息跌9.25% 2021上市超募11亿2022扣非降74%-世界观天下

光庭信息跌9 25%2021上市超募11亿2022扣非降74%

2023-06-29

网易游戏推AI巡逻员,首次用大模型监控未成年人防沉迷

6月28日,澎湃新闻记者获悉,网易游戏在游戏行业首次推出AI巡逻员提高

2023-06-29