1298

Capítulo 30 Cadenas, caracteres y expresiones regulares

30.1 Introducción

En este capítulo presentamos las herramientas para el procesamiento de cadenas y caracteres en Java. Las técnicas 
que se describen aquí son apropiadas para validar la entrada en los programas, para mostrar información a los 
usuarios y otras manipulaciones basadas en texto. Estas técnicas son también apropiadas para desarrollar editores 
de texto, procesadores de palabras, software para el diseño de páginas, sistemas de composición computarizados 
y demás tipos de software para el procesamiento de texto. Ya hemos presentado varias herramientas para el proce-
samiento de texto en capítulos anteriores. En este capítulo describiremos detalladamente las herramientas de las 
clases 

String

StringBuilder

 y 

Character

 del paquete 

java.lang

, y la clase 

StringTokenizer

 del paquete 

java.util

. Estas clases proporcionan la base para la manipulación de cadenas y caracteres en Java.

En este capítulo también hablaremos sobre las expresiones regulares que proporcionan a las aplicaciones la 

capacidad de validar los datos de entrada. Esta funcionalidad se encuentra en la clase 

String

, junto con las clases 

Matcher

 y 

Pattern

 ubicadas en el paquete 

java.util.regex

.

30.2 Fundamentos de los caracteres y las cadenas

Los caracteres son los bloques de construcción básicos de los programas fuente de Java. Todo programa está 
compuesto de una secuencia de caracteres que, cuando se agrupan en forma signifi cativa, son interpretados por 
la computadora como una serie de instrucciones utilizadas para realizar una tarea. Un programa puede contener 

literales de carácter

. Una literal de carácter es un valor entero representado como un carácter entre comillas 

simples. Por ejemplo, 

'z'

 representa el valor entero de 

z

, y 

'\n'

 representa el valor entero de una nueva línea. 

El valor de una literal de carácter es el valor entero del carácter en el 

conjunto de caracteres Unicode

. En el 

apéndice B se presentan los equivalentes enteros de los caracteres en el conjunto de caracteres ASCII, el cual es 
un subconjunto de Unicode (que veremos en el apéndice I). Para obtener información detallada sobre Unicode, 
visite 

www.unicode.org

.

 30.1 

Introducción

 30.2 

Fundamentos de los caracteres y las cadenas

 30.3 

La clase 

String

  

30.3.1 

Constructores de 

String

  

30.3.2 

Métodos

length

,

charAt

 y 

getChars

de

String

  

30.3.3 

Comparación entre cadenas

  

30.3.4 

Localización de caracteres y subcadenas en las cadenas

  

30.3.5 

Extracción de subcadenas de las cadenas

  

30.3.6 

Concatenación de cadenas

  

30.3.7 

Métodos varios de 

String

  

30.3.8 

Método

valueOf

 de 

String

 30.4 

La clase 

StringBuilder

  

30.4.1 

Constructores de 

StringBuilder

  

30.4.2 

Métodos

length

,

capacity

,

setLength

 y 

ensureCapacity

 de 

StringBuilder

  

30.4.3 

Métodos

charAt

,

setCharAt

,

getChars

 y 

reverse

 de 

StringBuilder

  

30.4.4 

Métodos

append

 de 

StringBuilder

  

30.4.5 

Métodos de inserción y eliminación de 

StringBuilder

 30.5 

La clase 

Character

 30.6 

La clase 

StringTokenizer

 30.7 

Expresiones regulares, la clase 

Pattern

 y la clase 

Matcher

 30.8 

Conclusión

Resumen | Terminología | Ejercicios de autoevaluación | Respuestas a los ejercicios de autoevaluación | Ejercicios

Sección especial: manipulación avanzada de cadenas | Sección especial: proyectos desafi antes de manipulación de cadenas

Plan gener

al

30_MAQ_CAP_30_DEITEL.indd1298

5/8/084:22:29PM