评论

收藏

[R语言] BZOJ-3555:企鹅QQ(字符串哈希)

编程语言 编程语言 发布于:2021-07-17 10:21 | 阅读数:272 | 评论:0

PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
Input第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
Output仅一行一个正整数,表示共有多少对相似的账户名称。
Sample Input4 3 64
Fax
fax
max
mac
Sample Output
4
Hint
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64
思路:对每个串都求一下哈希值,因为只有一位不同,所以可以枚举一下,将每个字符串删除同样位置的字符,然后排序比一下,要是有哈希值(已删去一个字符的)相等的,就算一对。详见代码注释:
1 #include<cstdio>
 2 #include<iostream>
 3 #include<string>
 4 #include<algorithm>
 5 
 6 using namespace std;
 7 typedef long long ll;//以下有爆掉的情况会自然溢出,超过ll自动对2^63取模 
 8 #define maxn 30005
 9 
10 const ll key=457;//选一个大素数做种子 
11 int n,m,s;
12 char str[maxn][205];
13 ll p[maxn]={1},a[maxn],sum[maxn][205];
14 ll ans;
15  
16 void hash(int x,char *s)//为每个字符串都赋一个映射的哈希函数值,就像它的代号 
17 {
18   for(int i=1;i<=m;i++) sum[x][i]=sum[x][i-1]*key+s[i];
19 }
20 void cal(int j)
21 {
22   for(int i=1;i<=n;i++)//对每个串都删去当前的。因为上一轮哈希值已经减去前一个字符的哈希值了,这一轮要加回来 
23     a[i]=sum[i][m]-sum[i][j]*p[m-j]+sum[i][j-1]*p[m-j+1];//这里p的应用,自己举个小例子画一画,把字符当成数字就好 
24   sort(a+1,a+1+n);
25   ll now=1;
26   for(int i=2;i<=n;i++)//因为排过序了,所以直接比较前一个和后一个的值,相等就加一组。因为是总对数,对now的当前值直接往答案上加 
27     if(a[i]==a[i-1]) ans+=now,now++;
28     else now=1;
29 }
30 int main()
31 {
32   scanf("%d%d%d",&n,&m,&s);
33   for(int i=1;i<=maxn;i++)//提前初始化一下p数组,p的使用方法配合之后的过程来体会
34     p[i]=p[i-1]*key; 
35   for(int i=1;i<=n;i++)//hash计算一下 
36     scanf("%s",str[i]+1),hash(i,str[i]);
37   for(int i=1;i<=m;i++)//枚举,删去下标为i的那个字符 
38     cal(i);
39   printf("%lld",ans);  
40   return 0;
41 }
10个月后重做:
唔,这是入驻博客园的第一篇题解,记得那时还懵懵逼逼看了半天黄学长代码才懂,且感到精妙……现在看来好像哈希莽一下就能过了,另外黄学长写那个题解的时候看来也还年轻啊……也是因为近一年里看过很多次这种类似进制的操作了吧。另外原来爆一爆longlong也能过啊,大概负数也算不冲突?当时好像以为longlong是自然溢出。
unordered_map是C++11的BZOJ不支持于是CE……map试了试被卡常于是TLE……只好sort一下,用了4秒多过去。
1 #include <cstdio>
 2 #include <algorithm>
 3 using namespace std;
 4 
 5 typedef unsigned long long ull;
 6 const int maxn = 3e5 + 5;
 7 const int seed = 257;
 8 
 9 int N, L, S, ans;
10 char str[maxn][205];
11 ull p[205], val[maxn], tmp[maxn];
12 
13 int main() {
14   scanf("%d %d %d", &N, &L, &S);
15   p[0] = 1;
16   for (int i = 1; i <= L; i++)
17     p[i] = p[i - 1] * seed;
18 
19   for (int i = 1; i <= N; i++) {
20     scanf("%s", str[i] + 1);
21     for (int j = 1; j <= L; j++) {
22       val[i] += p[j] * (int)str[i][j];
23     }
24   }
25 
26   for (int j = 1; j <= L; j++) {
27     for (int i = 1; i <= N; i++) {
28       tmp[i] = val[i] - p[j] * (int)str[i][j];
29     }
30     sort(tmp + 1, tmp + 1 + N);
31     for (int i = 1, pos = 1; i <= N; i = pos) {
32       while (pos <= N && tmp[pos] == tmp[i])  pos++;
33       ans += (pos - i) * (pos - i - 1) / 2;
34     }
35   }
36 
37   printf("%d\n", ans);
38   return 0;
39 }


关注下面的标签,发现更多相似文章