首页 > 编程知识 正文

RMQ算法,rm计算器

时间:2023-05-04 12:35:51 阅读:184040 作者:528

RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。

 

ST算法(Sparse Table),ST(Sparse Table)算法是一个非常有名的在线处理RMQ问题的算法,它可以在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。

以求最小值为例,设dp [ i, j ]表示[ i, i+2^j-1]这个区间内的最大值,那么在询问到[a,b]区间的最小值时答案就是min(dp[a,k], dp[b-2^k+1,k]),其中 k 是满足2^k<=b-a+1(即长度)的最大的k,即k=[ln(b-a+1)/ln(2)]。

注释: [a, a+(1<<k)-1] ~[b-2^k+1,b-2^k+1+2^k-1 ]  得到b-2^k+1>=a (=>  k<=[ln(b-a+1)/ln(2)] )(当且取等号时k最大)(k取到最大,能保证覆盖待求最值的区间)

那么如何求出dp[ i ][ j ]呢?

(一)首先是预处理,用动态规划(DP)解决。

设A[i]是要求区间最值的数列,dp [i, j]表示从第i个数起连续2^j个数中的最小值。(DP的状态)

例如:

A数列为:3 2 4 5 6 8 1 2 9 7

dp [1,0]表示第1个数起,长度为2^0=1的最小值,其实就是3这个数,然后F [ 2, 0 ]=2……

同理 dp[1,1] = min(3,2) = 2, dp[1,2]=min(3,2,4,5) = 2,dp [1,3] = min(3,2,4,5,6,8,1,2) = 1

 

并且我们可以容易的看出dp[i,0]就等于A[i]。(DP的初始值)

 

这样,DP的状态、初值都已经有了,剩下的就是状态转移方程。

我们把dp [i,j]平均分成两段(因为dp [ i,j ]一定是偶数个数字)。

从 i 到i + 2 ^ (j - 1) - 1为一段,i + 2 ^ (j - 1)到i + 2 ^ j - 1为一段(长度都为2 ^ (j - 1))。用上例说明,当i=1,j=3时就是3,2,4,5 和 6,8,1,2这两段。dp [i,j]就是这两段各自最小值中的最小值。于是我们得到了状态转移方程dp[i, j]=min(dp[i,j-1],dp[i + 2^(j-1),j-1])。

 

void rmp_st(int n) //预处理ST表,数组中共n个元素{ for(int i=1;i<=n;i++) dp[i][0]=A[i]; int m=(int)(log((double)n)/log(2.0))); //【i,i+2^j-1】2^j<= n(区间长度) j<=log n/ log2; //或者上步骤省略直接写成for(j=1;(2<<j)<=n;j++) ……  for(int j=1;j<=m;j++) { for(int i=1;i+(1<<j)-1<=n;i++) dp[i][j]=min(dp[i][j-1],dp[i+(1<<j)][j-1]); }}//预处理得到的dp[i][j]表示 从第i位到第i+2^j-1位当中最小的值</span>


这里我们需要注意的是循环的顺序,我们发现外层是j,内层所i,这是为什么呢?可以是i在外,j在内吗?

 

答案是不可以。因为我们需要理解这个状态转移方程的意义。

状态转移方程的含义是:先更新所有长度为dp [ i,0 ] 即1个元素,然后通过2个1个元素的最值,获得所有长度为dp [i,1]即2个元素的最值,然后再通过2个2个元素的最值,获得所有长度为dp [i,2]即4个元素的最值,以此类推更新所有长度的最值。而如果是i在外,j在内的话,我们更新的顺序就是dp [1,0],dp [1,1],dp [1,2],dp [1,3],表示更新从1开始1个元素,2个元素,4个元素,8个元素(A[0],A[1],....A[7])的最值,这里

dp[1,3]=min(min(A[0],A[1],A[2],A[3]),min(A[4],A[5],A[6],A[7]))的值,但是我们根本没有计算min(A[0],A[1],A[2],A[3])和min(A[4],A[5],A[6],A[7]),所以这样的方法肯定是错误的。

 

为了避免这样的错误,一定要好好理解这个状态转移方程所代表的含义。

 

(二)然后是查询。

 

假如我们需要查询的区间为( i,j ),那么我们需要找到覆盖这个闭区间(左边界取i,右边界取j)的最小幂(可以重复,比如查询5,6,7,8,9,我们可以查询5678和6789)。

因为这个区间的长度为j - i + 1,所以我们可以取k=log2( j - i + 1)(k取到最大)。

则有:RMQ(A, i, j)=min{ dp [i , k], dp [ j - 2 ^ k + 1, k]}。

举例说明,要求区间[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求min (dp [2, 2],dp [8 - 2 ^ 2 + 1, 2]) = min (dp [2, 2],F[5, 2]);

 

在这里我们也需要注意一个地方,就是<<运算符和+-运算符的优先级。

比如这个表达式:5 - 1 << 2是多少?

 

答案是:4 * 2 * 2 = 16。所以我们要写成5 - (1 << 2)才是5-1 * 2 * 2 = 1。

 

int rmp_find(int l,int r) //求区间 l 到 r 之间的最值{ int k=(int)(log(double(r-l+1))/log(2.0)); return min(dp[l][k],dp[r-(1<<k)+1][k]) }

 

 

 

 

 

 

 

 

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。