学习Excel技术,关注微信公众号:
excelperfect
在文章开始之前,解释一下什么是不同值?什么是唯一值?
例如,下面的一组数据:
a,a,b,b,c,d,e,e,f
我们说,这组数据有6个不同值:a,b,c,d,e,f;有3个唯一值:c,d,f,因为它们在列表中只出现了1次。
我们要求这组数据中不同值的数量,可以使用数组公式:
=SUM(--(FREQUENCY(IF(A1:A9<>"",MATCH("~"& A1:A9,A1:A9&"",0)),ROW(A1:A9)-ROW(A1)+1)>0))
结果如下图1所示。

图1
然而,这个公式不仅复杂,而且在处理混合数据时会很慢。因此,我们可以使用VBA来编写自定义函数。
使用Collection对象来统计不同值
代码如下:
Public Function COUNTDISTINCTcol(ByRef rngToCheck As Range) As VariantDim colDistinct As CollectionDim varValues As VariantDim varValue As VariantDim lngCount As LongDim lngRow As LongDim lngCol As LongOn Error GoTo ErrorHandlervarValues= rngToCheck.Value'如果rngToCheck多于1个单元格'那么varValues是一个二维数组If IsArray(varValues) ThenSet colDistinct = New CollectionFor lngRow = LBound(varValues, 1) To UBound(varValues, 1)For lngCol = LBound(varValues, 2) To UBound(varValues, 2)varValue = varValues(lngRow, lngCol)'忽略空单元格'如果单元格包含错误值则触发错误If LenB(varValue) > 0 Then'如果该项已存在则会触发错误'忽略该错误On Error Resume NextcolDistinct.Add vbNullString, CStr(varValue)On Error GoTo ErrorHandlerEnd IfNext lngColNext lngRowlngCount = colDistinct.CountElseIf LenB(varValues) > 0 ThenlngCount = 1End IfEnd IfCOUNTDISTINCTcol = lngCountExit FunctionErrorHandler:COUNTDISTINCTcol = CVErr(xlErrValue)End Function
集合中的每个项目都必须具有唯一键,并且该唯一键必须是字符串。如果代码尝试创建重复键,则会引发错误。由于OnError Resume Next语句,该错误被忽略。VBACollection 对象的一个特性是键不区分大小写。
LenB函数用于检查单元格是否为空白。如果单元格包含错误值,则此时将引发错误并且自定义函数将返回#VALUE!。空单元格意味着:
单元格中什么也没有
有一个零长字符串
仅仅有一个前缀符号(通常是’)
使用Dictionary对象来统计不同值
在编写代码前,先添加对MicrosoftScripting Runtime库的引用。在VBE中,单击“工具——引用”,找到并勾选“MicrosoftScripting Runtime”,如下图2所示。

图2
代码如下:
Public Function COUNTDISTINCTdicNew(ByRef rngToCheck As Range) As Variant'早期绑定'需要引用Microsoft Scripting Runtime库Dim dicDistinct As Scripting.DictionaryDim varValues As VariantDim varValue As VariantDim lngCount As LongDim lngRow As LongDim lngCol As LongDim strValue As StringOn Error GoTo ErrorHandlervarValues= rngToCheck.Value'如果rngToCheck多于1个单元格'那么varValues是一个二维数组If IsArray(varValues) ThenSet dicDistinct = CreateObject("Scripting.Dictionary")dicDistinct.CompareMode = TextCompareFor lngRow = LBound(varValues, 1) To UBound(varValues, 1)For lngCol = LBound(varValues, 2) To UBound(varValues, 2)varValue = varValues(lngRow, lngCol)'忽略空单元格'如果单元格包含错误值则触发错误If LenB(varValue) > 0 Then'将所有内容转换为字符串'字典对类型不敏感strValue = CStr(varValue)If Not dicDistinct.Exists(strValue) ThendicDistinct.Add strValue, vbNullStringEnd IfEnd IfNext lngColNext lngRowlngCount = dicDistinct.CountElseIf LenB(varValues) > 0 ThenlngCount = 1End IfEnd IfCOUNTDISTINCTdicNew = lngCountExit FunctionErrorHandler:COUNTDISTINCTdicNew = CVErr(xlErrValue)End Function
这段代码在第一次调用后保留现有Dictionary对象并随后清除。使用Static关键字代替Dim,以便在函数调用之间保留Dictionary对象引用:
Public Function COUNTDISTINCTdicStatic(ByRef rngToCheck As Range) As VariantStatic dicDistinct As Scripting.DictionaryDim varValues As VariantDim varValue As VariantDim lngCount As LongDim lngRow As LongDim lngCol As LongDim strValue As StringOn Error GoTo ErrorHandlervarValues= rngToCheck.Value'如果rngToCheck多于1个单元格'那么varValues是一个二维数组If IsArray(varValues) ThenIf dicDistinct Is Nothing ThenSet dicDistinct = CreateObject("Scripting.Dictionary")dicDistinct.CompareMode = TextCompareElsedicDistinct.RemoveAllEnd IfFor lngRow = LBound(varValues, 1) To UBound(varValues, 1)For lngCol = LBound(varValues, 2) To UBound(varValues, 2)varValue = varValues(lngRow, lngCol)'忽略空单元格'如果单元格包含错误值则触发错误If LenB(varValue) > 0 Then'将所有内容转换为字符串'字典对类型不敏感strValue = CStr(varValue)If Not dicDistinct.Exists(strValue) ThendicDistinct.Add strValue, vbNullStringEnd IfEnd IfNext lngColNext lngRowlngCount = dicDistinct.CountElseIf LenB(varValues) > 0 ThenlngCount = 1End IfEnd IfCOUNTDISTINCTdicStatic = lngCountExit FunctionErrorHandler:COUNTDISTINCTdicStatic = CVErr(xlErrValue)End Function
下面是上述方式统计不同值的结果,如下图3所示。

图3
正如所看到的,这4个公式都对数据类型不敏感,也对大小写不敏感。
扩展的不同值统计——Dictionary对象
代码如下:
Public Function COUNTDISTINCT(ByRef rngToCheck AsRange, _Optional ByVal blnCaseSensitive As Boolean = True) As VariantStatic dicDistinctAs Scripting.DictionaryDim varValues As VariantDim varValue As VariantDim lngCount As LongDim lngRow As LongDim lngCol As LongOn Error GoTo ErrorHandlerSet rngToCheck = Intersect(rngToCheck.Worksheet.UsedRange, rngToCheck)If No trngToCheck Is Nothing Then'将单元格值分配到内存中'以便更快地使用它们varValues = rngToCheck.Value'如果rngToCheck多于1个单元格'那么varValues是一个二维数组If IsArray(varValues) ThenIf dicDistinct Is Nothing ThenSet dicDistinct = CreateObject("Scripting.Dictionary")dicDistinct.CompareMode = BinaryCompareElsedicDistinct.RemoveAllEnd IfFor lngRow = LBound(varValues, 1) ToUBound(varValues, 1)For lngCol = LBound(varValues, 2) To UBound(varValues, 2)varValue = varValues(lngRow, lngCol)'忽略错误值If Not IsError(varValue) Then'忽略空单元格'包括公式返回的""If LenB(varValue) >0 Then'如果是字符串'那么允许区分大小写If VarType(varValue) = vbString ThenIf Not blnCaseSensitive ThenvarValue =UCase(varValue)End IfEnd IfIf Not dicDistinct.Exists(varValue)ThendicDistinct.AddvarValue, vbNullStringEnd IfEnd IfEnd IfNext lngColNext lngRowlngCount = dicDistinct.CountElse'如果单元格包含错误或为空则忽略If Not IsError(varValues) ThenIf LenB(varValues) > 0 ThenlngCount = 1End IfEnd IfEnd IfEnd IfCOUNTDISTINCT = lngCountExit FunctionErrorHandler:COUNTDISTINCT = CVErr(xlErrValue)End Function
注意以下几点:
可以统计数字、文本和逻辑数据类型,但会忽略错误值,例如#N/A和DIV/0!。
忽略空(和空白)单元格。
默认情况下区分大小写。
区分数据类型。例如,这两个公式将被认为是不同的:=TRUE()和="True",就像 ="1" 和 =1。
需要对 MicrosoftScripting Runtime 库的引用。如果不包含引用,则需要将Dictionary 对象声明为 Object类型,并将BinaryCompare设置为等于0的常量。
可以处理跨多列的数据。
示例如下图4所示。

图4
扩展的唯一值统计——Dictionary对象
与上面的代码相似:
Public Function COUNTUNIQUE(ByRef rngToCheck AsRange, _Optional ByVal blnCaseSensitive As Boolean = True) As VariantStatic dicDistinct As ObjectDim varValues As VariantDim varValue As VariantDim varItems As VariantDim lngCount As LongDim lngItem As LongDim lngRow As LongDim lngCol As LongOn Error GoTo ErrorHandlerSet rngToCheck = Intersect(rngToCheck.Worksheet.UsedRange, rngToCheck)If Not rngToCheck Is Nothing Then'将单元格值分配到内存中'以便更快地使用它们varValues = rngToCheck.Value'如果rngToCheck多于1个单元格'那么varValues是一个二维数组If IsArray(varValues) ThenIf dicDistinct Is Nothing ThenSet dicDistinct = CreateObject("Scripting.Dictionary")dicDistinct.CompareMode = BinaryCompareElsedicDistinct.RemoveAllEnd IfFor lngRow = LBound(varValues, 1) To UBound(varValues, 1)For lngCol = LBound(varValues, 2) To UBound(varValues, 2)varValue = varValues(lngRow, lngCol)'忽略错误值If Not IsError(varValue) Then'忽略空单元格'包括公式返回的""If LenB(varValue) >0 Then'如果是字符串'那么允许区分大小写If VarType(varValue) = vbString ThenIf NotblnCaseSensitive ThenvarValue =UCase(varValue)End IfEnd If'如果已存在则统计其出现了多少次If dicDistinct.Exists(varValue) ThendicDistinct.Item(varValue) = dicDistinct.Item(varValue) + 1Else'添加其出现1次dicDistinct.AddvarValue, 1End IfEnd IfEnd IfNext lngColNext lngRow'仅对出现一次的项varItems = dicDistinct.ItemsFor lngItem = LBound(varItems, 1) To UBound(varItems, 1)If varItems(lngItem) = 1 ThenlngCount = lngCount + 1End IfNext lngItemElse'如果单元格包含错误或为空则忽略If Not IsError(varValues) ThenIf LenB(varValues) > 0 ThenlngCount = 1End IfEnd IfEnd IfEnd IfCOUNTUNIQUE = lngCountExit FunctionErrorHandler:COUNTUNIQUE = CVErr(xlErrValue)End Function
结果如下图5所示。

图5
注:本文整理自colinlegg.wordpress.com,供有兴趣的朋友学习参考。
欢迎到知识星球:完美Excel社群,进行技术交流和提问,获取更多电子资料。





