注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

鑫淼梦园的博客

圆你的梦想 从这里开始

 
 
 

日志

 
 

Delphi中比较两个字符串相似性的百分比算法   

2013-01-03 19:47:39|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
用百分比比较两个字符串(彼此之间有多少相似度) 返回 byte 类型,从 0 到 100%

function  CompareStringsInPercent(Str1, Str2: string ): Byte;
type
   TLink = array [0..1] of  Byte;
var
   tmpPattern: TLink;
  PatternA, PatternB: array of  TLink;
  IndexA, IndexB, LengthStr: Integer;
begin
   Result := 100;
  // Building pattern tables
   LengthStr := Max(Length(Str1), Length(Str2));
  for  IndexA := 1 to  LengthStr do 
  begin
    if  Length(Str1) >= IndexA then 
    begin
       SetLength(PatternA, (Length(PatternA) + 1));
      PatternA[Length(PatternA) - 1][0] := Byte(Str1[IndexA]);
      PatternA[Length(PatternA) - 1][1] := IndexA;
    end ;
    if  Length(Str2) >= IndexA then 
    begin
       SetLength(PatternB, (Length(PatternB) + 1));
      PatternB[Length(PatternB) - 1][0] := Byte(Str2[IndexA]);
      PatternB[Length(PatternB) - 1][1] := IndexA;
    end ;
  end ;
  // Quick Sort of pattern tables
   IndexA := 0;
  IndexB := 0;
  while  ((IndexA < (Length(PatternA) - 1)) and  (IndexB < (Length(PatternB) - 1))) do 
  begin
    if  Length(PatternA) > IndexA then 
    begin
      if  PatternA[IndexA][0] < PatternA[IndexA + 1][0] then 
      begin
         tmpPattern[0]           := PatternA[IndexA][0];
        tmpPattern[1]           := PatternA[IndexA][1];
        PatternA[IndexA][0]     := PatternA[IndexA + 1][0];
        PatternA[IndexA][1]     := PatternA[IndexA + 1][1];
        PatternA[IndexA + 1][0] := tmpPattern[0];
        PatternA[IndexA + 1][1] := tmpPattern[1];
        if  IndexA > 0 then  Dec(IndexA);
      end
      else 
         Inc(IndexA);
    end ;
    if  Length(PatternB) > IndexB then 
    begin
      if  PatternB[IndexB][0] < PatternB[IndexB + 1][0] then 
      begin
         tmpPattern[0]           := PatternB[IndexB][0];
        tmpPattern[1]           := PatternB[IndexB][1];
        PatternB[IndexB][0]     := PatternB[IndexB + 1][0];
        PatternB[IndexB][1]     := PatternB[IndexB + 1][1];
        PatternB[IndexB + 1][0] := tmpPattern[0];
        PatternB[IndexB + 1][1] := tmpPattern[1];
        if  IndexB > 0 then  Dec(IndexB);
      end
      else 
         Inc(IndexB);
    end ;
  end ;
  // Calculating simularity percentage
   LengthStr := Min(Length(PatternA), Length(PatternB));
  for  IndexA := 0 to  (LengthStr - 1) do 
  begin
    if  PatternA[IndexA][0] = PatternB[IndexA][0] then 
    begin
      if  Max(PatternA[IndexA][1], PatternB[IndexA][1]) - Min(PatternA[IndexA][1],
        PatternB[IndexA][1]) > 0 then  Dec(Result,
        ((100 div  LengthStr) div  (Max(PatternA[IndexA][1], PatternB[IndexA][1]) -
          Min(PatternA[IndexA][1], PatternB[IndexA][1]))))
      else if  Result < 100 then  Inc(Result);
    end
    else 
       Dec(Result, (100 div  LengthStr))
  end ;
  SetLength(PatternA, 0);
  SetLength(PatternB, 0);
end ;
  评论这张
 
阅读(300)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017