题目

字符串 APPAPT 中包含了两个单词 PAT,其中第一个 PAT 是第 2 位(P),第 4 位(A),第 6 位(T);第二个 PAT 是第 3 位(P),第 4 位(A),第 6 位(T)。

现给定字符串,问一共可以形成多少个 PAT

输入格式:

输入只有一行,包含一个字符串,长度不超过 $10^5$ ,只包含 PAT 三种字母。

输出格式:

在一行中输出给定字符串中包含多少个 PAT。由于结果可能比较大,只输出对 1000000007 取余数的结果。

输入样例:

1
APPAPT

输出样例:

1
2

思路

这明明是一道数学题。。

怎么分析呢?从前向后扫描:

  • 每个A对应的PA组合数量是A之前P的数量
  • 每个T对应的PAT组合数量是T之前所有A对应的PA组合数量的累加,
  • 所有的PAT组合数量是所有T对应的PAT组合数量的累加

。。。懂?。。。

其实看通过率应该是很多人都会的哈。这道题属于典型的90%时间用于思考,10%时间用于码代码的类型。。。。

然后证明一下这个magic number——1000000007为什么是这个数(大概等于)以及什么时候应该取模: 我们用有符号32位整型来计数,按照我代码里的变量名:P、PA、PAT。

  • P每次自增1,因此最大会达到$10^5$,不需取模。
  • PA每次累加P的值,我们来看一个比较极端的情况:
    • "PAPA ... (共50000对PA) ... PA",这样记录PA的组合数量,就是 PA=$\sum_{i=1}^{50000}i=2500050000$,就已经大于int了,因此计算PA应该取模。
  • PAT每次累加PA的值,因此两个值都会比较大,必须要取模。累加之后的数会小于2000000013,这个值小于int的最大值$2^{31}-1=2147483647$,不会溢出(模取得过大就会在没来得及取模之前就溢出了,我觉得这是关键)。
    • 那用unsigned int呢,PA是不是不需要取模了?我觉得是的。
  • 这道题是要检查答案的,用一个素数做模应该有避免巧合答案的考虑。

写完这个发现博客 http://www.liuchuo.net/archives/573 也有相关的解释,并且解题思路也不一样,是累加每个A两边P和T的个数之积。

代码

Github最新代码,欢迎交流

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include <stdio.h>

#define LIM 1000000007

int main()
{
	int P = 0, PA = 0, PAT = 0;
	char c;

	while ((c = getchar()) != EOF && c != '\n') {
		if (c == 'P')
			P++;
		if (c == 'A')
			PA = (PA + P) % LIM;
		if (c == 'T')
			PAT = (PAT + PA) % LIM;
	}
	printf("%d", PAT);

	return 0;
}