欢迎光临
我的个人博客网站

算法面试题:一个List<Student>,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

算法面试题:一个List,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

解题思路

这是群里某位小伙伴去面试碰到的面试题,从题目本身来看,面试官应该是要考察面试者对泛型 List 的理解程度,也算是对基础的理解。这里面还是有很多需要考察的知识点,没关系,我们走一步看一步。

首先,题目没有限定数量,我们知道,只谈毒性不谈剂量的都是耍流氓,那我们就假定要处理的数据有 10000 条好了。

数据准备好了

static readonly string text

看到上面的这堆 0110 是不是有点懵逼?

没关系,我刚看到的时候也是一样的,用下面的代码把他转换成数组就好

List<int> students = new List<int>(); for (int i = 0; i < text.Length; i++) {     students.Add(text[i] - 48); } 

你看,事情往往就是这么简单、有趣,一个 for 循环就完美解决了我们的麻烦。

方案一:暴力解题法

看到这个题目,我们常常第一时间就是想到循环,遍历找出这帮真男人(1)就好了不是?

来吧,下面就是一段暴力 for 循环

List<int> newStudents = new List<int>(); for (int i = 0; i < students.Count; i++) {     if (students[i] == 1)         newStudents.Add(students[i]); } 

你看,这种以暴制暴的方式往往就是这么枯燥、无趣。

知识点来了!!!

由于我们声明了一个 newStudents 的泛型对象,这个对象在初始化的时候,默认大小是多少?正确答案是 4 。是的,你没看错,咱 .NETCore 就是这么扣,就是任性,就给你 4 个长度的列表。

那咱们就要问了,这 4 个是怎么装下这么多男人(1)的呢?

动态扩容

答案是:当我们调用 List.Add() 的时候,如果当前列表长度小于容量,即 Length < Capacity,那么数据就正常的装入列表中,如果即将装入的数据长度 + 现有的列表长度 > 容量,即 Length > Capacity,那么 List 底层就会进行自动扩容。

每次扩容多少合适呢?翻倍!

没错,就是这么简单有效,咱直接翻倍了,不装了,不算了,就是这么简单有效,咱就翻倍。

看 List 的底层扩容的实现

private void EnsureCapacity(int min) {     if (_items.Length < min) {         int newCapacity = _items.Length == 0? _defaultCapacity : _items.Length * 2;         // Allow the list to grow to maximum possible capacity (~2G elements) before encountering overflow.         // Note that this check works even when _items.Length overflowed thanks to the (uint) cast         if ((uint)newCapacity > Array.MaxArrayLength) newCapacity = Array.MaxArrayLength;         if (newCapacity < min) newCapacity = min;         Capacity = newCapacity;     } } 

重新分配内存扩容

看上面的代码,当调用 Capacity = newCapacity;进行扩容的时候,内存将进行重新分配,具体做法就是在属性 Capacity 内部,使用 newCapacity 声明一个新的数组,然后把源数组中的内容复制到新数组中。

public int Capacity {     get {         Contract.Ensures(Contract.Result<int>() >= 0);         return _items.Length;     }     set {         if (value < _size) {             ThrowHelper.ThrowArgumentOutOfRangeException(ExceptionArgument.value, ExceptionResource.ArgumentOutOfRange_SmallCapacity);         }         Contract.EndContractBlock();          if (value != _items.Length) {             if (value > 0) {                 T[] newItems = new T[value];                 if (_size > 0) {                     Array.Copy(_items, 0, newItems, 0, _size);                 }                 _items = newItems;             }             else {                 _items = _emptyArray;             }         }     } } 

所以,由此推断,我们一开始的暴力迭代方案将会在运行时发生多少次内存分配和 GC 呢,我们算一下,4/8/16/32/64/128/256/512/1024,算了,我算不过来了,反正就是很多很多!

暴力修正方案

从上面的知识点可以得知,我们应该一开始就应该声明一个合适长度的 List

但是,我们又没有办法知道有多少男人(1)呀,那怎么办,这种时候就要逆向思维,声明一个足够大的数组,你源数据不是有 10000 条吗,那我就假定 10000 个都是男人(1),声明一个 10000 人的列表好了。

List<int> newStudents = new List<int>(students.Count); for (int i = 0; i < students.Count; i++) {     if (students[i] == 1)         newStudents.Add(students[i]); } 

完美!

方案二:算法实现

既然是算法题,如果只考察内存和GC,那未免显得我们学识粗浅,下面我们对数据进行排序,然后再截取数组实现解题。

冒泡排序

我们这里使用经典的冒泡排序法,当然你可以二分或者其它,随意发挥好了。

int total = 0; for (int i = 0; i < students.Count; i++) {     if (i == 1)         total++;     for (int j = 0; j < i; j++)     {         if (students[j] < students[i])         {             var stu = students[i];             students[i] = students[j];             students[j] = stu;             total++;             break;         }     } } 

上面的代码实现了对数据进行排序,排序的同时不要浪费机会,借机获取了男人(1)的数量,为下面的节省内存分配做准备,既然学了就要应用是吧。

截取数组

int[] newStudents = new int[total]; students.CopyTo(0, newStudents, 0, newStudents.Length); 

截取数组的代码非常简单,首先利用排序得到的数量声明合适的列表,然后利用 List.CopyTo() ,方法即可得到男人(1)。

这里的 students.CopyTo() 底层实现顺便告诉大家,使用的是 Array.CopyTo()。是的,你没看错,咱

这是 List 的底层的实现

public void CopyTo(int index, T[] array, int arrayIndex, int count) {     if (_size - index < count) {         ThrowHelper.ThrowArgumentException(ExceptionResource.Argument_InvalidOffLen);     }     Contract.EndContractBlock();          // Delegate rest of error checking to Array.Copy.     Array.Copy(_items, index, array, arrayIndex, count); } 

本质上都是调用 Array 的方法。

方案三:修剪法

经过两轮磋商,相信这个时候面试官想必对你已经是刮目相看,别着急,下面还有一个方案,利用迭代列表,去修剪列表中的女人(0),剩下的自然都是男人(1)。

for (int i = 0; i < students.Count; i++) {     if (students[i] == 0)     {         students.RemoveAt(i);     } } 
  • 注意了,这是一段错误的代码!

  • 注意了,这是一段错误的代码!

  • 注意了,这是一段错误的代码!

上面的修剪代码虽然看似执行了修剪女人(0)的过程,实际上,我们要了解的是,在修剪的过程中, students.Count 会随着修剪的执行过程而同时会发生改变,最终结果就是,修剪长度被缩短,导致部分女人(1)没有得到修剪检查。

看 List.RemoveAt() 的内部实现。

public void RemoveAt(int index) {     if ((uint)index >= (uint)_size) {         ThrowHelper.ThrowArgumentOutOfRangeException();     }     Contract.EndContractBlock();     _size--;     if (index < _size) {         Array.Copy(_items, index + 1, _items, index, _size - index);     }     _items[_size] = default(T);     _version++; } 

List.Count 属性的返回值正式上文中的 _size;所以,你现在明白这个方案为什么是个错误了吧。

方案三的修正版本

那么我们就没有办法使用修剪方案了吗?

不是的,请年轻人先把40米的大刀收一收,我们来修正一下上面的修剪方案。

for (int i = 0; i < students.Count; i++) {     if (students[i] == 0)     {         students.RemoveAt(i);         i--;     } } 

具体做法就是在执行修剪操作后,将当前下标 i 和 students.Count 进行同步,一个小小的改动,我们实现了修剪。

性能问题

通过上面的三种方案,我们学习了 List 的内部执行机制,了解了内存分配和GC的回收过程,那么这三种方案的性能怎么样呢?

是时候上图了。

算法面试题:一个List&lt;Student&gt;,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

总结

好了,今天的面试就到这里结束。

通过上面的性能对比,我们可以看到排序方案的耗时最高,耗时高达 166ms ,而其它两个方案的耗时都为 0,当然,从内存占用来看,排序方案肯定是要优秀一些的了,但是在这个求快的时代,内存这个可怜的家伙很多时候都会被我们安排在优化的第二梯队。

而从综合考虑,修剪方案较为可行(仅针对本题)。

赞(0) 打赏
未经允许不得转载:张拓的天空 » 算法面试题:一个List<Student>,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

专业的IT技术经验分享 更专业 更方便

联系我们本站主机

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏