1.2 如何从无序链表中移除重复项_C#程序员面试算法宝典-QQ阅读男生武侠网

难度系数：★★★☆☆　被考察系数：★★★★☆

题目描述：

给定一个没有排序的链表，去掉其重复项，并保留原顺序，例如链表1-＞3-＞1-＞5-＞5-＞7，去掉重复项后变为1-＞3-＞5-＞7。

分析与解答：

方法一：顺序删除

主要思路为：通过双重循环直接在链表上进行删除操作。外层循环用一个指针从第一个结点开始遍历整个链表，然后内层循环用另外一个指针遍历其余结点，将与外层循环遍历到的指针所指结点的数据域相同的结点删除。如下图所示：

假设外层循环从outerCur开始遍历，当内层循环指针innerCur遍历到上图实线所示的位置（outerCur.data==innerCur.data）时，此时需要把innerCur指向的结点删除。具体步骤如下：

1）用tmp记录待删除的结点的地址；

2）为了能够在删除tmp结点后继续遍历链表中其余的结点，使innerCur指向它的后继结点：innerCur=innerCur.next。

3）从链表中删除tmp结点。

实现代码如下：

程序的运行结果为

算法性能分析：

由于这个算法采用双重循环对链表进行遍历，因此，时间复杂度为O（n²），其中，n为链表的长度，在遍历链表的过程中，使用了常量个额外的指针变量来保存当前遍历的结点、前驱结点和被删除的结点，因此，空间复杂度为O（1）。

方法二：递归法

主要思路为：对于结点cur，首先递归地删除以cur.next为首的子链表中重复的结点，接着从以cur.next为首的子链表中找出与cur有着相同数据域的结点并删除，实现代码如下：

用方法一中的Main函数运行这个方法可以得到相同的运行结果。

算法性能分析：

这个方法与方法一类似，从本质上而言，由于这个方法需要对链表进行双重遍历，因此，时间复杂度为O（n²），其中，n为链表的长度。由于递归法会增加许多额外的函数调用，因此，从理论上讲，该方法效率比方法一低。

方法三：空间换时间

通常情况下，为了降低时间复杂度，往往在条件允许的情况下，通过使用辅助空间实现。具体而言，主要思路为：

1）建立一个HashSet，HashSet中的内容为已经遍历过的结点内容，并将其初始化为空。

2）从头开始遍历链表中的所以结点，存在以下两种可能性：

① 如果结点内容已经在HashSet中，则删除此结点，继续向后遍历。

② 如果结点内容不在HashSet中，则保留此结点，将此结点内容添加到HashSet中，继续向后遍历。

引申：如何从有序链表中移除重复项

分析与解答：

上述介绍的方法也适用于链表有序的情况，但是由于以上方法没有充分利用到链表有序这个条件，因此，算法的性能肯定不是最优的。本题中，由于链表具有有序性，因此，不需要对链表进行两次遍历。所以，有如下思路：用 cur 指向链表第一个结点，此时需要分为以下两种情况讨论：

1）如果cur.data==cur.next.data，那么删除cur.next结点；

2）如果cur.data！=cur.next.data，那么cur=cur.next，继续遍历其余结点。