gwtproject
diff --git a/‎user/super/com/google/gwt/emul/java/lang/CaseMapper.java‎
Lines changed: 17 additions & 1 deletion b/‎user/super/com/google/gwt/emul/java/lang/CaseMapper.java‎
Lines changed: 17 additions & 1 deletion
diff --git a/‎user/super/com/google/gwt/emul/java/lang/Character.java‎
Lines changed: 178 additions & 43 deletions b/‎user/super/com/google/gwt/emul/java/lang/Character.java‎
Lines changed: 178 additions & 43 deletions
@@ -23,7 +23,23 @@ public static char charToLowerCase(char c) {
   }
 
   public static char charToUpperCase(char c) {
-    return String.valueOf(c).toUpperCase().charAt(0);
+    String upper = String.valueOf(c).toUpperCase();
+    return hasExtraCodePoints(upper) ? c : upper.charAt(0);
+  }
+
+  public static int intToLowerCase(int codePoint) {
+    return String.NativeString.fromCodePoint(codePoint).toLowerCase().codePointAt(0);
+  }
+
+  public static int intToUpperCase(int codePoint) {
+    String upper = String.NativeString.fromCodePoint(codePoint).toUpperCase();
+    return hasExtraCodePoints(upper) ? codePoint : upper.codePointAt(0);
+  }
+
+  // If String.toUpperCase produces more than 1 codepoint, Character.toUpperCase should
+  // act either as identity or title-case conversion (not supported in GWT).
+  private static boolean hasExtraCodePoints(String str) {
+    return str.asNativeString().codePointAt(1) > 0;
   }
 
   private CaseMapper() {}
 
@@ -26,24 +26,21 @@
  *
  * TODO(jat): many of the classification methods implemented here are not
  * correct in that they only handle ASCII characters, and many other methods
- * are not currently implemented.  I think the proper approach is to introduce * a deferred binding parameter which substitutes an implementation using
+ * are not currently implemented.  I think the proper approach is to introduce
+ * a deferred binding parameter which substitutes an implementation using
  * a fully-correct Unicode character database, at the expense of additional
  * data being downloaded.  That way developers that need the functionality
  * can get it without those who don't need it paying for it.
  *
  * <pre>
  * The following methods are still not implemented -- most would require Unicode
  * character db to be useful:
- *  - digit / is* / to*(int codePoint)
- *  - isDefined(char)
+ *  - digit(int codePoint)
  *  - isIdentifierIgnorable(char)
  *  - isJavaIdentifierPart(char)
  *  - isJavaIdentifierStart(char)
  *  - isJavaLetter(char) -- deprecated, so probably not
  *  - isJavaLetterOrDigit(char) -- deprecated, so probably not
- *  - isISOControl(char)
- *  - isMirrored(char)
- *  - isSpaceChar(char)
  *  - isUnicodeIdentifierPart(char)
  *  - isUnicodeIdentifierStart(char)
  *  - getDirectionality(*)
@@ -55,9 +52,6 @@
  *
  * The following do not properly handle characters outside of ASCII:
  *  - digit(char c, int radix)
- *  - isDigit(char c)
- *  - isLetter(char c)
- *  - isLetterOrDigit(char c)
  *  - isLowerCase(char c)
  *  - isUpperCase(char c)
  * </pre>
@@ -72,11 +66,11 @@ static class CharSequenceAdapter implements CharSequence {
     private int start;
     private int end;
 
-    public CharSequenceAdapter(char[] charArray) {
+    CharSequenceAdapter(char[] charArray) {
       this(charArray, 0, charArray.length);
     }
 
-    public CharSequenceAdapter(char[] charArray, int start, int end) {
+    CharSequenceAdapter(char[] charArray, int start, int end) {
       this.charArray = charArray;
       this.start = start;
       this.end = end;
@@ -234,57 +228,136 @@ public static boolean isBmpCodePoint(int codePoint) {
     return codePoint >= MIN_VALUE && codePoint <= MAX_VALUE;
   }
 
+  private static NativeRegExp definedRegex;
+
+  public static boolean isDefined(char c) {
+    return isDefined(String.valueOf(c));
+  }
+
+  public static boolean isDefined(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isDefined(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isDefined(String str) {
+    if (definedRegex == null) {
+      definedRegex = new NativeRegExp("\\P{Cn}", "u");
+    }
+    return definedRegex.test(str);
+  }
+
   private static NativeRegExp digitRegex;
 
-  /*
-   * TODO: correct Unicode handling.
-   */
   public static boolean isDigit(char c) {
+    return isDigit(String.valueOf(c));
+  }
+
+  // Known differences between Java 17 and Chrome 135
+  // 11f50 .. 11f59, 16ac0 .. 16ac9, 1e4f0 .. 1e4f9, 1fbf0 .. 1fbf9
+  public static boolean isDigit(int codePoint) {
+    return isValidCodePoint(codePoint) && isDigit(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isDigit(String str) {
     if (digitRegex == null) {
-      digitRegex = new NativeRegExp("\\d");
+      digitRegex = new NativeRegExp("\\p{Nd}", "u");
     }
-    return digitRegex.test(String.valueOf(c));
+    return digitRegex.test(String.valueOf(str));
   }
 
   public static boolean isHighSurrogate(char ch) {
     return ch >= MIN_HIGH_SURROGATE && ch <= MAX_HIGH_SURROGATE;
   }
 
+  private static NativeRegExp ideographicRegex;
+
+  public static boolean isIdeographic(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isIdeographic(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isIdeographic(String str) {
+    if (ideographicRegex == null) {
+      ideographicRegex = new NativeRegExp("\\p{Ideographic}", "u");
+    }
+    return ideographicRegex.test(str);
+  }
+
   private static NativeRegExp leterRegex;
 
-  /*
-   * TODO: correct Unicode handling.
-   */
   public static boolean isLetter(char c) {
+    return isLetter(String.valueOf(c));
+  }
+
+  public static boolean isLetter(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isLetter(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  public static boolean isLetter(String str) {
     if (leterRegex == null) {
-      leterRegex = new NativeRegExp("[A-Z]", "i");
+      leterRegex = new NativeRegExp("\\p{L}", "u");
     }
-    return leterRegex.test(String.valueOf(c));
+    return leterRegex.test(str);
   }
 
   private static NativeRegExp isLeterOrDigitRegex;
 
-  /*
-   * TODO: correct Unicode handling.
-   */
   public static boolean isLetterOrDigit(char c) {
     if (isLeterOrDigitRegex == null) {
-      isLeterOrDigitRegex = new NativeRegExp("[A-Z\\d]", "i");
+      isLeterOrDigitRegex = new NativeRegExp("[\\p{Nd}\\p{L}]", "u");
     }
     return isLeterOrDigitRegex.test(String.valueOf(c));
   }
 
-  /*
-   * TODO: correct Unicode handling.
-   */
+  private static NativeRegExp lowerCaseRegex;
+
   public static boolean isLowerCase(char c) {
-    return toLowerCase(c) == c && isLetter(c);
+    return isLowerCase(String.valueOf(c));
+  }
+
+  public static boolean isLowerCase(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isLowerCase(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isLowerCase(String str) {
+    if (lowerCaseRegex == null) {
+      lowerCaseRegex = new NativeRegExp("\\p{Lowercase}", "u");
+    }
+    return lowerCaseRegex.test(str);
   }
 
   public static boolean isLowSurrogate(char ch) {
     return ch >= MIN_LOW_SURROGATE && ch <= MAX_LOW_SURROGATE;
   }
 
+  private static NativeRegExp mirroredRegex;
+
+  public static boolean isMirrored(char c) {
+    return isMirrored(String.valueOf(c));
+  }
+
+  public static boolean isMirrored(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isMirrored(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isMirrored(String str) {
+    if (mirroredRegex == null) {
+      mirroredRegex = new NativeRegExp("\\p{Bidi_Mirrored}", "u");
+    }
+    return mirroredRegex.test(str);
+  }
+
+  public static boolean isISOControl(char ch) {
+    return ch <= '\u001F' || (ch >= '\u007F' && ch <= '\u009F');
+  }
+
+  public static boolean isISOControl(int codePoint) {
+    return codePoint <= '\u001F' || (codePoint >= '\u007F' && codePoint <= '\u009F');
+  }
+
   /**
    * Deprecated - see isWhitespace(char).
    */
@@ -306,12 +379,35 @@ public static boolean isSpace(char c) {
     }
   }
 
+  private static NativeRegExp spaceRegex;
+
+  public static boolean isSpaceChar(char c) {
+    return isSpaceChar(String.valueOf(c));
+  }
+
+  public static boolean isSpaceChar(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isSpaceChar(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isSpaceChar(String str) {
+    if (spaceRegex == null) {
+      spaceRegex = new NativeRegExp("\\p{Z}", "u");
+    }
+    return spaceRegex.test(str);
+  }
+
+  public static boolean isSurrogate(char ch) {
+    return ch >= MIN_SURROGATE && ch <= MAX_SURROGATE;
+  }
+
   public static boolean isWhitespace(char ch) {
     return isWhitespace(String.valueOf(ch));
   }
 
   public static boolean isWhitespace(int codePoint) {
-    return isWhitespace(String.fromCodePoint(codePoint));
+    return isValidCodePoint(codePoint)
+        && isWhitespace(String.NativeString.fromCodePoint(codePoint));
   }
 
   private static NativeRegExp whitespaceRegex;
@@ -339,14 +435,31 @@ public static boolean isSurrogatePair(char highSurrogate, char lowSurrogate) {
 
   public static boolean isTitleCase(char c) {
     // https://www.compart.com/en/unicode/category/Lt
-    return c != toUpperCase(c) && c != toLowerCase(c);
+    // here we should use the semantic of String.toUpperCase
+    return c != String.valueOf(c).toUpperCase().charAt(0) && c != toLowerCase(c);
   }
 
-  /*
-   * TODO: correct Unicode handling.
-   */
+  public static boolean isTitleCase(int codePoint) {
+    // as of Unicode 16 there are no title-case chars beyond 0xffff
+    return codePoint > 0 && codePoint < 0xffff && isTitleCase((char) codePoint);
+  }
+
+  private static NativeRegExp upperCaseRegex;
+
   public static boolean isUpperCase(char c) {
-    return toUpperCase(c) == c && isLetter(c);
+    return isUpperCase(String.valueOf(c));
+  }
+
+  public static boolean isUpperCase(int codePoint) {
+    return isValidCodePoint(codePoint)
+        && isUpperCase(String.NativeString.fromCodePoint(codePoint));
+  }
+
+  private static boolean isUpperCase(String c) {
+    if (upperCaseRegex == null) {
+      upperCaseRegex = new NativeRegExp("\\p{Uppercase}", "u");
+    }
+    return upperCaseRegex.test(c);
   }
 
   public static boolean isValidCodePoint(int codePoint) {
@@ -390,8 +503,8 @@ public static char[] toChars(int codePoint) {
 
     if (codePoint >= MIN_SUPPLEMENTARY_CODE_POINT) {
       return new char[] {
-          getHighSurrogate(codePoint),
-          getLowSurrogate(codePoint),
+          highSurrogate(codePoint),
+          lowSurrogate(codePoint),
       };
     } else {
       return new char[] {
@@ -404,8 +517,8 @@ public static int toChars(int codePoint, char[] dst, int dstIndex) {
     checkCriticalArgument(codePoint >= 0 && codePoint <= MAX_CODE_POINT);
 
     if (codePoint >= MIN_SUPPLEMENTARY_CODE_POINT) {
-      dst[dstIndex++] = getHighSurrogate(codePoint);
-      dst[dstIndex] = getLowSurrogate(codePoint);
+      dst[dstIndex++] = highSurrogate(codePoint);
+      dst[dstIndex] = lowSurrogate(codePoint);
       return 2;
     } else {
       dst[dstIndex] = (char) codePoint;
@@ -426,14 +539,36 @@ public static char toLowerCase(char c) {
     return CaseMapper.charToLowerCase(c);
   }
 
+  public static int toLowerCase(int codePoint) {
+    if (codePoint > MAX_CODE_POINT) {
+      return codePoint;
+    }
+    return CaseMapper.intToLowerCase(codePoint);
+  }
+
   public static String toString(char x) {
     return String.valueOf(x);
   }
 
+  public static String toString(int codePoint) {
+    if (isValidCodePoint(codePoint)) {
+      return String.NativeString.fromCodePoint(codePoint);
+    } else {
+      throw new IllegalArgumentException("Invalid code point: " + codePoint);
+    }
+  }
+
   public static char toUpperCase(char c) {
     return CaseMapper.charToUpperCase(c);
   }
 
+  public static int toUpperCase(int codePoint) {
+    if (!isValidCodePoint(codePoint)) {
+      return codePoint;
+    }
+    return CaseMapper.intToUpperCase(codePoint);
+  }
+
   public static Character valueOf(char c) {
     if (c < 128) {
       return BoxedValues.get(c);
@@ -473,26 +608,26 @@ static char forDigit(int digit) {
 
   /**
    * Computes the high surrogate character of the UTF16 representation of a
-   * non-BMP code point. See {@link getLowSurrogate}.
+   * non-BMP code point. See {@link #lowSurrogate}.
    *
    * @param codePoint requested codePoint, required to be >=
    *          MIN_SUPPLEMENTARY_CODE_POINT
    * @return high surrogate character
    */
-  static char getHighSurrogate(int codePoint) {
+  public static char highSurrogate(int codePoint) {
     return (char) (MIN_HIGH_SURROGATE
         + (((codePoint - MIN_SUPPLEMENTARY_CODE_POINT) >> 10) & 1023));
   }
 
   /**
    * Computes the low surrogate character of the UTF16 representation of a
-   * non-BMP code point. See {@link getHighSurrogate}.
+   * non-BMP code point. See {@link #highSurrogate}.
    *
    * @param codePoint requested codePoint, required to be >=
    *          MIN_SUPPLEMENTARY_CODE_POINT
    * @return low surrogate character
    */
-  static char getLowSurrogate(int codePoint) {
+  public static char lowSurrogate(int codePoint) {
     return (char) (MIN_LOW_SURROGATE + ((codePoint - MIN_SUPPLEMENTARY_CODE_POINT) & 1023));
   }