百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

以图搜图之“感知哈希”算法实现(以图搜图找原图)

wuantov 2025-07-19 23:10 7 浏览

00、背景

Google图片搜索是Google公司于2001年7月推出的图片搜索服务。

Google总裁Eric Schmidt表示,Google图片的建立,是因为他想要看"珍妮弗·洛佩兹的绿色范思哲礼服"

2001年,Google图片编入了2.5亿张图片。2005年,这一数字增长到了十亿。到了2010年,已可搜索100亿张图片。截至2010年7月,该服务每天被访问超过一亿次。

01、感知哈希(Perceptual hashing )

感知哈希是使用指纹算法生成各种形式的多媒体的片段、哈希或指纹。

感知哈希是一种位置敏感哈希,如果多媒体的特征相似,则它是类似的。

这与加密哈希相反,加密哈希依赖于输入值的微小变化造成输出值的巨大变化的雪崩效应。

感知散列函数广泛用于查找在线版权侵权案件以及数字取证,因为散列之间具有相关性,因此可以找到相似的数据(例如具有不同的水印)。

它是基于DCT(离散余弦变换)来得到图片的hash值,具体步骤如下:

1、缩小图片:32*32是一个较好的大小,这样方便DCT计算;

2、灰度化:转换为256阶灰度图;

3、计算DCT:DCT把图片分离成分率的集合,DCT(离散余弦变换);

4、缩小DCT:DCT计算后的矩阵是32 * 32,保留左上角的8 * 8,这些代表的图片的最低频率;

5、计算平均值:计算缩小DCT后的所有像素点的平均值;

6、比较平均值:大于平均值记录为1,反之记录为0,得到phash值。

02、发展历史

Marr 和 Hildreth 1980 年的工作是该领域的开创性论文。

Christoph Zauner 2010 年 7 月的论文对该主题进行了精彩的介绍。

2016 年 6 月,Azadeh Amir Asgari 发表了有关鲁棒图像哈希欺骗的研究成果。Asgari 指出,感知哈希函数像任何其他算法一样容易出错。

研究人员在 2017 年 12 月表示,谷歌图像搜索基于感知哈希。

PHA是一类比较哈希方法的统称。图片所包含的特征被用来生成一组指纹(不过它不是唯一的),而这些指纹是可以进行比较的。

这个算法非常巧妙,无论你改变图片的高宽、亮度甚至颜色,都不会改变哈希值。

03、实现示意

04、核心代码

使用差分哈希算法计算图像的64位哈希

  /// <summary>
  /// 使用差分哈希算法计算图像的64位哈希。
  /// </summary>
  /// <param name="image">读取到的图片流</param>
  /// <returns>256位hash值</returns>
  public ulong[] DifferenceHash256(Image<Rgba32> image)
  {
      var pixels = _transformer.TransformImage(image, 17, 16);

      // 遍历像素,如果左侧像素比右侧像素亮,则将哈希设置为1。
      var hash = new ulong[4];
      var hashPos = 0;
      var hashPart = 0;
      for (var i = 0; i < 16; i++)
      {
          var rowStart = i * 17;
          for (var j = 0; j < 16; j++)
          {
              if (pixels[rowStart + j] > pixels[rowStart + j + 1])
              {
                  hash[hashPart] |= 1UL << hashPos;
              }

              if (hashPos == 63)
              {
                  hashPos = 0;
                  hashPart++;
              }
              else
              {
                  hashPos++;
              }
          }
      }

      return hash;
  }

构建索引

      private async void btnIndex_Click(object sender, EventArgs e)
      {
          if (IndexRunning)
          {
              IndexRunning = false;
              btnIndex.Text = "更新索引";
              return;
          }

          if (string.IsNullOrEmpty(txtDirectory.Text))
          {
              MessageBox.Show("请先选择文件夹");
              return;
          }

          IndexRunning = true;
          btnIndex.Text = "停止索引";
          cbRemoveInvalidIndex.Hide();
          var imageHasher = new ImageHasher(new ImageSharpTransformer());
          int? filesCount = null;
          Task.Run(() => filesCount = Directory.EnumerateFiles(txtDirectory.Text, "*", SearchOption.AllDirectories).Except(_index.Keys).Count(s => Regex.IsMatch(s, "(jpg|png|bmp)#34;, RegexOptions.IgnoreCase))).ConfigureAwait(false);
          var local = new ThreadLocal<int>(true);
          await Task.Run(() =>
          {
              var sw = Stopwatch.StartNew();
              long size = 0;
              Directory.EnumerateFiles(txtDirectory.Text, "*", SearchOption.AllDirectories).Except(_index.Keys).Where(s => Regex.IsMatch(s, "(jpg|png|bmp)#34;, RegexOptions.IgnoreCase)).Chunk(Environment.ProcessorCount * 2).AsParallel().WithDegreeOfParallelism(Environment.ProcessorCount * 2).ForAll(g =>
                {
                    foreach (var s in g)
                    {
                        if (IndexRunning)
                        {
                            if (lblProcess.InvokeRequired)
                            {
                                local.Value++;
                                lblProcess.Invoke(() => lblProcess.Text = #34;{local.Values.Sum()}/{filesCount}");
                            }
                            try
                            {
                                _index.GetOrAdd(s, _ => imageHasher.DifferenceHash256(s));
                                size += new FileInfo(s).Length;
                            }
                            catch
                            {
                                LogManager.Info(s + "格式不正确");
                            }
                        }
                        else
                        {
                            break;
                        }
                    }
                });
              lbSpeed.Text = #34;索引速度: {Math.Round(local.Values.Sum() * 1.0 / sw.Elapsed.TotalSeconds)} items/s({size * 1f / 1048576 / sw.Elapsed.TotalSeconds:N}MB/s)";
              if (cbRemoveInvalidIndex.Checked)
              {
                  foreach (var (key, _) in _index.AsParallel().WithDegreeOfParallelism(32).Where(s => !File.Exists(s.Key)))
                  {
                      _index.TryRemove(key, out _);
                  }
              }

              lbIndexCount.Text = _index.Count + "文件";
              cbRemoveInvalidIndex.Show();
              var json = JsonSerializer.Serialize(_index);
              File.WriteAllText("index.json", json, Encoding.UTF8);
              MessageBox.Show("索引创建完成,耗时:" + sw.Elapsed.TotalSeconds + "s");
          }).ConfigureAwait(false);
          IndexRunning = false;
          btnIndex.Text = "更新索引";
      }

索引结构如下:

05、最后效果

匹配度100%:

匹配度74.21%:

相关推荐

SQL关联各种JOIN傻傻分不清楚,读这一篇就够了

在关系型数据库中支持多表关联,不同场景下通过不同join方式让分布在不同表中的数据呈现在同一个结果里。熟练使用sql联合查询是日常开发的基础工作。为了方便演示讲解,假设有两个表,一张是保存学生踢足球的...

MyBatis的SQL执行流程不清楚?看完这一篇就够了

推荐学习真香警告!Alibaba珍藏版mybatis手写文档,刷起来全网独家的“MySQL高级知识”集合,骨灰级收藏,手慢则无前言MyBatis可能很多人都一直在用,但是MyBatis的SQL执行...

SQL优化这十条,面试的时候你都答对了吗?

尽量不要在要给在SQL语句的where子句中使用函数,这样会使索引失效。如果已经确定查询结果只有一条数据(当表中数据的该字段是唯一的),在查询SQL末尾增加limit1,这样MySQL的查询执行引...

SQL查询Excel结果数据还可这样输出到窗体控件ListBox和ListView

上一期作品,我们分享了通过SQL查询Excel的结果数据输出到Excel自身的工作表区域。大家估计应该感觉到了SQL查询的强大功能,它对精确或模糊查询均无畏惧,优点是查询检索效率高,将查询结果输出的形...

数据库|SQLServer数据库:模糊查询的三种情况

哈喽,你好啊,我是雷工!就是字面意思,当数据库的查询条件并不是十分具体时就用到模糊查询,比如查询姓氏为雷的人名,就需要从姓名列模糊查询。01like关键字查询当使用like关键字进行查询时,字段中的...

数据库教程-SQL Server多条件模糊查询

表单查询是以数据存储管理为基础的信息管理系统各业务功能实现的基础,也是数据库CRUD操作的重点与难点,尤其是多表连接查询、条件查询、分组查询、聚合函数等的综合应用。本文以某一比赛样式要求为基础,对数据...

如何利用教育网站源码成功搭建在线教育网站

如今是一个信息化时代,人们都想接受各种各样的教育,在线教育也就因此发展了起来,并且逐渐成为了一种趋势。而成熟的在线教育网站皆是由高质量的教育网站源码搭建而成的。如何利用教育网站源码成功搭建在线教育网站...

宝塔搭建WordPress跨境电商外贸商城模板汉化woodmart7.5.1源码

大家好啊,欢迎来到web测评。本期给大家带来一套php开发的WoodmartV7.5.1汉化主题|跨境电商|外贸商城|产品展示网站模板WordPress主题,是wordpress开发的。上次是谁要的系...

小狐狸ChatGPT付费创作系统V2.4.7全开源版 (vue全开源端)

测试环境:Nginx1.20+PHP7.4+MySQL5.7本版本为官方的最新开源包对应V2.4.7版本,包含了前后端所有开源包,是目前最新全开源版本,需要二开的这部分朋友也有选择了,如果不需要二...

php宝塔搭建部署thinkphp红色大气装修公司官网php源码

大家好啊,欢迎来到web测评。本期给大家带来一套php开发的thinkphp红色大气装修公司官网源码,上次是谁要的系统项目啊,帮你找到了,还说不会搭建,让我帮忙录制一期教程,趁着今天有空,简单的录制测...

php宝塔搭建免登录积分商城系统php源码

大家好啊,欢迎来到web测评。本期给大家带来一套php开发的免登录积分商城系统php源码,上次是谁要的系统项目啊,帮你找到了,还说不会搭建,让我帮忙录制一期教程,趁着今天有空,简单的录制测试了一下,部...

零代码搭建接口收费平台——接口大师YesApi

主流的API接口收费模式目前各大API接口平台,采用的收费模式主可以分为:免费接口、免费试用、接口流量套餐、先充值后按量计费的模式。例如,聚合数据的API收费模式是:按接口流量套餐。例如身份证二要素...

php宝塔搭建部署实战抽奖系统开源php源码

大家好啊,我是测评君,欢迎来到web测评。本期给大家带来一套抽奖系统开源php源码。感兴趣的朋友可以自行下载学习。技术架构PHP5.4+nginx+mysql5.7+JS+CSS+...

【推荐】一款开源个人与企业私有化部署使用的在线知识库管理平台

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍zyplayer-doc是一款基于Java+Vue开源、专注于个人与企业私有化部署使用的在线知识库管...

网上的付费文档无法下载?这几个方法10秒搞定,任意免费复制

工作或者学习过程中,我们很多时候需要在网上找资料,但是想要的资料却要付费或者提示无法下载怎么办?别怕,这几个方法,让你10秒就能搞定付费文档,任意复制。1.打印界面复制遇到文档需要付费或者无法复制的...