首页 > 编程知识 正文

关于string的面试题

时间:2023-05-06 06:42:25 阅读:187164 作者:3436

资料来源: r6d.cn/Fmku

前言在Java中,String有长度限制。 听到这里,我不得不怀疑String是否有长度的限制。 是的,我有。 此外,JVM编译还有规范。 另外,也有在面试中遇到的家人。

我在面试的时候听过这个。 而且,在以前开发的东西中,实际上也遇到过这个字符串长度限制的场面。 (将某个固定文件转码为Base64形式,以字符串形式保存,在运行时必要时返回。 当时文件很大。 ) )那么,这个规格限制是什么样的,不是我们的故事。

String首先,要知道String的长度限制,必须知道String是如何存储字符串的。 String实际上使用char类型的数组来存储字符串中的字符。

存储字符串的容器本来就是它,既然字符串是数组存储,数组有长度限制吗? 是的,有限制,但有前提条件。 让我们看看如何在String中返回length。

在String类的length方法中,可以从中看出返回类型是int类型。 在Java中,可以通过定义数组来指定数组的长度。 当然,如果不指定的话,默认情况下会根据数组元素指定:

int[]arr1=newint[10]; //长度为10的数组int [ ] arr2={ 1,2,3,4,5 }; //那么这个时候数组的长度是5整数在java中是有限制的。 在源代码中查看与int类型对应的包装类Integer,其最大长度限制为2^31 -1,表明数组的长度为0~2^31-1。 那么,计算一下,(2^31-1=2147483647=

Integer的取值范围看到了这一点,试图通过编码来验证上述观点。

既然用文字形式定义字符串,不是说我通过定义文字形式构建的10万个字符的字符串,编译后虚拟机报告错误,说我们的字符串长度太长,能存21亿个吗? 为什么用10万个搞错了呢?

实际上,这里提到了JVM编译规范的限制。 实际上,如果JVM在编译时将字符串定义为文字形式,则在编译时JVM会将其存储在常量池中。 此时,JVM对在此常量池中存储字符串类型进行了限制。 接下来看看手册吧。

在javavirtualmachinespecification的截图常量池中,每个cp_info条目必须采用相同的格式,并且以一个表示cp_info类型的1字节“tag”条目开头。 后面的info[]项的内容取决于tag的类型。

在javavirtualmachinespecification手册常量类型表中,可以看到String类型的显示为CONSTANT_String。 让我们来看看CONSTANT_String具体是如何定义的。

此处定义的u2 string_index表示常量池的有效索引,其类型由CONSTANT_Utf8_info结构表示。 这里应该注意的是,这里定义的length看下图。

在class文件中,u2表示无符号的数为2字节单位,因为已知1字节为8比特,2字节为16比特,所以2字节可表示的范围为2^16- 1=65535。 范中class文件格式总结了u1、u2定义的解释:

本节介绍java虚拟机规则的概要部分

1、class文件中的文件内容类型解释定义了一组表示class文件内容的专用数据类型。 它们包含u1、u2和u4,分别表示1、2和4字节的无符号数。

每个Class文件由8个字节的字节流组成,所有16位、32位和64位长度的数据都以2个、4个和8个8字节为单位表示。

2、程序异常处理的有效范围说明start_pc和end_pc两个项的值显示了异常处理器的code[]排列下的有效范围。

start_pc必须是当前code[]数组中某个指令的操作码的有效索引,end_pc是当前code[]数组中的某个指令的操作码的有效索引,或者等于cod

e_length 的值,即当前 code[]数组的长度。start_pc 的值必须比 end_pc 小。

当程序计数器在范围[start_pc, end_pc)内时,异常处理器就将生效。即设 x 为 异常句柄的有效范围内的值,x 满足:start_pc ≤ x < end_pc。

实际上,end_pc 值本身不属于异常处理器的有效范围这点属于 Java 虚拟机历史上 的一个设计缺陷:如果 Java 虚拟机中的一个方法的 code 属性的长度刚好是 65535 个字节,并且以一个 1 个字节长度的指令结束,那么这条指令将不能被异常处理器 所处理。

不过编译器可以通过限制任何方法、实例初始化方法或类初始化方法的code[]数组最大长度为 65534,这样可以间接弥补这个 BUG。

注意:这里对个人认为比较重要的点做了标记,首先第一个加粗说白了就是说数组有效范围就是【0-65565】但是第二个加粗的地方又解释了,因为虚拟机还需要1个字节的指令作为结束,所以其实真正的有效范围是【0-65564】,这里要注意这里的范围仅限编译时期,如果你是运行时拼接的字符串是可以超出这个范围的。

接下来我们通过一个小实验来测试一下我们构建一个长度为65534的字符串,看看是否就能编译通过。0期阶段汇总

首先通过一个for循环构建65534长度的字符串,在控制台打印后,我们通过自己度娘的一个在线字符统计工具计算了一下确实是65534个字符,如下:

然后我们将字符复制后以定义字面量的形式赋值给字符串,可以看到我们选择这些字符右下角显示的确实是65534,于是乎运行了一波,果然成功了。

看到这里我们来总结一下:

问:字符串有长度限制吗?是多少?

答:首先字符串的内容是由一个字符数组 char[] 来存储的,由于数组的长度及索引是整数,且String类中返回字符串长度的方法length() 的返回值也是int ,所以通过查看java源码中的类Integer我们可以看到Integer的最大范围是2^31 -1,由于数组是从0开始的,所以数组的最大长度可以使【0~2^31】通过计算是大概4GB。

但是通过翻阅java虚拟机手册对class文件格式的定义以及常量池中对String类型的结构体定义我们可以知道对于索引定义了u2,就是无符号占2个字节,2个字节可以表示的最大范围是2^16 -1 = 65535。

其实是65535,但是由于JVM需要1个字节表示结束指令,所以这个范围就为65534了。超出这个范围在编译时期是会报错的,但是运行时拼接或者赋值的话范围是在整形的最大范围。

整理份Git学习资料,手把手教你代码管理

获取方法

加我微信,备注:git

(一定要备注:git)否则啥得不到


没错,不是机器人

耐心等待,人多我会一个个回复!

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。