C# string转unicode字符

news/2025/2/26 8:41:13

在 C# 中,将字符串转换为 Unicode 字符(即每个字符的 Unicode 码点)可以通过遍历字符串中的每个字符并获取其 Unicode 值来实现。Unicode 值是一个整数,表示字符在 Unicode 标准中的唯一编号。

以下是实现方法:


1. 获取字符串中每个字符的 Unicode 值

使用 char 类型的隐式转换或 Convert.ToInt32 方法可以获取字符的 Unicode 值。

示例代码:
using System;

class Program
{
    static void Main()
    {
        string input = "Hello 你好";
        foreach (char c in input)
        {
            int unicodeValue = c; // 隐式转换为 Unicode 值
            Console.WriteLine($"字符: {c}, Unicode 值: {unicodeValue}");
        }
    }
}
输出:
字符: H, Unicode 值: 72
字符: e, Unicode 值: 101
字符: l, Unicode 值: 108
字符: l, Unicode 值: 108
字符: o, Unicode 值: 111
字符:  , Unicode 值: 32
字符: 你, Unicode 值: 20320
字符: 好, Unicode 值: 22909

2. 将 Unicode 值格式化为 \u 转义字符

如果需要将 Unicode 值格式化为 \u 开头的转义字符(例如 \u0041 表示字符 A),可以使用 ToString("X4") 将 Unicode 值转换为 4 位十六进制字符串

示例代码:
using System;

class Program
{
    static void Main()
    {
        string input = "Hello 你好";
        foreach (char c in input)
        {
            int unicodeValue = c;
            string unicodeEscape = $"\\u{unicodeValue:X4}"; // 格式化为 \uHHHH
            Console.WriteLine($"字符: {c}, Unicode 转义字符: {unicodeEscape}");
        }
    }
}
输出:
字符: H, Unicode 转义字符: \u0048
字符: e, Unicode 转义字符: \u0065
字符: l, Unicode 转义字符: \u006C
字符: l, Unicode 转义字符: \u006C
字符: o, Unicode 转义字符: \u006F
字符:  , Unicode 转义字符: \u0020
字符: 你, Unicode 转义字符: \u4F60
字符: 好, Unicode 转义字符: \u597D

3. 字符串整体转换为 Unicode 转义字符

如果需要将整个字符串转换为 Unicode 转义字符格式,可以遍历字符串并拼接结果。

示例代码:
using System;
using System.Text;

class Program
{
    static void Main()
    {
        string input = "Hello 你好";
        StringBuilder unicodeBuilder = new StringBuilder();

        foreach (char c in input)
        {
            int unicodeValue = c;
            unicodeBuilder.Append($"\\u{unicodeValue:X4}");
        }

        string unicodeString = unicodeBuilder.ToString();
        Console.WriteLine(unicodeString); // 输出: \u0048\u0065\u006C\u006C\u006F\u0020\u4F60\u597D
    }
}

4. 处理 Surrogate Pair(代理对)

对于某些 Unicode 字符(如表情符号或某些特殊字符),它们可能由两个 char 值(称为代理对)表示。需要使用 char.IsSurrogatePairchar.ConvertToUtf32 来处理。

示例代码:
using System;
using System.Text;

class Program
{
    static void Main()
    {
        string input = "Hello 😊 你好";
        StringBuilder unicodeBuilder = new StringBuilder();

        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsSurrogatePair(input, i))
            {
                // 处理代理对
                int codePoint = char.ConvertToUtf32(input, i);
                unicodeBuilder.Append($"\\U{codePoint:X8}"); // 使用 \U 表示 8 位十六进制
                i++; // 跳过下一个 char
            }
            else
            {
                // 处理普通字符
                int unicodeValue = input[i];
                unicodeBuilder.Append($"\\u{unicodeValue:X4}");
            }
        }

        string unicodeString = unicodeBuilder.ToString();
        Console.WriteLine(unicodeString); // 输出: \u0048\u0065\u006C\u006C\u006F\u0020\U0001F60A\u0020\u4F60\u597D
    }
}

5. 总结

  • 使用 char 的隐式转换或 Convert.ToInt32 获取字符的 Unicode 值。
  • 使用 ToString("X4") 将 Unicode 值格式化为 \uHHHH 转义字符。
  • 对于代理对字符,使用 char.ConvertToUtf32\UHHHHHHHH 格式。
  • 遍历字符串并拼接结果,可以将整个字符串转换为 Unicode 转义字符格式。

通过这些方法,你可以在 C# 中轻松地将字符串转换为 Unicode 字符或转义字符格式。


http://www.niftyadmin.cn/n/5868406.html

相关文章

[H滑动窗口] lc239. 滑动窗口最大值(模拟+数据结构+单调队列+滑动窗口模板题)

文章目录 1. 题目来源2. 题目解析 1. 题目来源 链接&#xff1a;239. 滑动窗口最大值 相关博文&#xff1a; [单调队列模板] 单调队列模板 题单&#xff1a; 待补充 2. 题目解析 一道单调队列模板题&#xff0c;不赘述了吧。 看看日后有没有写不出来来补题、或者有新…

深入理解 `Sinks.Empty<Void>` 和 `Mono<Void>`:如何触发完成信号并结合 WebSocket 示例

在响应式编程中&#xff0c;Sinks 是 Project Reactor 提供的一个强大工具&#xff0c;用于手动控制数据流的信号发射。Sinks.Empty<Void> 是一种特殊的 Sinks&#xff0c;它不发射任何数据&#xff0c;仅用于表示完成或错误信号。结合 Mono<Void>&#xff0c;它可…

网络基础知识-2

N个节点完全互联的网型网即N个节点的无向完全图&#xff0c;无向完全图的边数计算如下&#xff1a;每个节点都要指向其他N-1个节点&#xff0c;但是因为无向两个节点之间的边会重复&#xff0c;因此有N(N-1)/2条边HDLC&#xff08;高级数据链路控制协议&#xff09;是一种面向比…

二叉树-左叶子之和

代码随想录-刷题笔记 404. 左叶子之和 - 力扣&#xff08;LeetCode&#xff09; 内容&#xff1a; 该题仅作为搜索&#xff0c;但是其中的规则让人摸不着头脑&#xff0c;看起来似乎很头疼 但是仔细一思考&#xff0c;能发现左叶子无非是这样的定义 当发现一个节点的 左孩…

单片机裸机编程:状态机与其他高效编程框架

在单片机裸机编程中&#xff0c;状态机是一种非常强大的工具&#xff0c;能够有效管理复杂的逻辑和任务切换。除了状态机&#xff0c;还有其他几种编程模式可以在不使用 RTOS 的情况下实现高效的程序设计。以下是一些常见的方法&#xff1a; 1. 状态机编程 状态机通过定义系统…

C语言 —— 此去经年 应是良辰好景虚设 - 函数

目录 1. 函数的概念 1.1 库函数 1.2 自定义函数 2. 形参和实参 3. return 语句 4. 数组做函数参数 5. 嵌套调用和链式访问 5.1 嵌套调用 5.2 链式访问 6. 函数的声明和定义 6.1 单个文件 6.2 多个文件 7. static 和 extern 7.1 static 修饰局部变量 7.2 static 修…

Java GC 基础知识快速回顾

目录 一、Java 垃圾回收&#xff08;GC&#xff09;基本概念和重要性分析 &#xff08;一&#xff09; Java 垃圾回收&#xff08;GC&#xff09;基本概念回顾 1.GC 三种常见语义 2.Mutator&#xff1a;应用程序的内存管理角色 3.TLAB&#xff08;线程本地分配缓存&#x…

数据结构与算法面试专题——桶排序

引入 桶排序&#xff0c;顾名思义&#xff0c;会用到“桶”&#xff0c;核心思想是将要排序的数据分到几个有序的桶里&#xff0c;每个桶里的数据再单独进行排序。桶内排完序之后&#xff0c;再把每个桶里的数据按照顺序依次取出&#xff0c;组成的序列就是有序的了。 桶排序…