Posts
Suarne
Cancel

写在前面:补一个之前已经做好笔记的算法—TKE,该算法是在频繁项集的背景下进行top-k情节挖掘,解决阈值设定问题。 TKE: Mining Top-K Frequent Episodes 定义 有限事件集:$E = \lbrace i_1, i_2, \dots, i_{\rm m}\rbrace$ 同时事件集:$SE_{\rm t_i}$ 表示有...

写在前面:继UP-Span算法之后,研究一下加上top-k之后挖掘效率是否会效果更强,通常而言,top-k领域挖掘算法对密集型数据集效率会有显著的提升,而且针对UP-Span算法的不足,top-k的策略在一定程度上可以解决。 Top-K High Utility Episode Mining from a Complex Event Sequence 样本 定义 ...

写在前面:episode pattern挖掘不同于itemset pattern挖掘,其复杂程度是远远超过itemset,首先“情节”意味着一系列事件的发生,在一段时间内有多个itemset产生,这些itemset之间可能先后发生,也可能同时发生。也就是说episode挖掘不仅要考虑横向的事件序列,而且还要结合纵向事件集。 Mining High Utility Episodes in C...

Top-K HUIs算法的比对分析 写在前面:最近在研究Top-k高效用挖掘算法,在老师的介绍下接触到这篇文献,该作者很贴心地为我们介绍了 top-k HUI mining 的几个关键方法,与其它高效用模式挖掘算法的对比评估,还有当下top-k算法的不足之处。本文记录对该文献翻译上的理解和自己的思考,如果错误还望指正。 介绍 ​ 该段从频繁模式挖掘(FIM)入手,我们都知道频...

写在前面:在老师介绍这篇文章的时候确实让我眼前一亮,为什么之前自己就没有联系到存在负效用情况?看来自己对这些算法理念还是没有融会贯通,这些算法都是为生活服务的。本篇记录对EHIN文献上翻译的个人理解,如有错误还望指正。 HUIs with Negative utility algorithm EFIM中的定义 设 $I$ = $\lbrace I_1, I_2, \cd...

写在前面:该算法 目的是在比HUI-Miner算法更高效率,关键在于两个新上界:revised sub-tree utility、local utility来压缩高效检索空间。 并且通过快速效用值计算算法FAC(Fast Utility Counting)来在线性时间内获取上界值和检索空间。 更进一步,通过HDP(High-utility Database Projectio...

高效用项集挖掘 因为原高效用项集挖掘模式会产生许多低阈值的候选集,所以用效用列表(utility-list)来替代候选集的作用。 样本 $I = \lbrace i_1, i_2, \dots, i_n\rbrace$ 每个$i$在效用表($utility \; table$)中都存在对应的效用值($utility \, value$) $X$是关于$i$的集合,叫效用集 ...

In Chirpy, the image files of Favicons are placed in assets/img/favicons/. You may need to replace them with your own. So let’s see how to customize these Favicons. With a square image (PNG, JPG o...

Naming and Path Create a new file named YYYY-MM-DD-TITLE.EXTENSION and put it in the _post/ of the root directory. Please note that the EXTENSION must be one of md and markdown. From v2.4.1, you c...

This article is to show markdown syntax rendering on Chirpy, you can also use it as an example of writing. Now, let’s start looking at text and typography. Titles H1 H2 H3 H4 Paragraph I...