算法最优解 算法最优解
首页
目录
赞助
GitHub (opens new window)
首页
目录
赞助
GitHub (opens new window)
  • 数据结构基础

  • 数组

  • 位运算

  • 动态规划

  • 图

  • 区间

  • 链表

  • 矩阵

  • 字符串

    • 无重复字符的最长子串
    • 替换后的最长重复字符
    • 最小覆盖子串
    • 滑动窗口最大值
    • 有效的字母异位词
    • 字母异位词分组
      • 题目描述
      • 视频讲解
      • 思路解析
        • 方法一 排序法
        • C++代码
        • java代码
        • python代码
        • 复杂度分析
        • 方法二 字母统计法
        • C++代码
        • java代码
        • python代码
        • 复杂度分析
    • 找到字符串中所有字母异位词
    • 有效括号
    • 验证回文串
    • 最长回文子串
    • 回文子串
  • 树

  • 堆

  • 逻辑思维

  • 目录
  • 字符串
华南溜达虎
2024-07-08
目录

字母异位词分组

题目链接: https://leetcode.cn/problems/group-anagrams/

视频题解: https://www.bilibili.com/video/BV1Fm42157HG/

# LeetCode 49. 字母异位词分组

# 题目描述

给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。

字母异位词 是由重新排列源单词的所有字母得到的一个新单词。

举个例子:

输入: strs = ["eat", "tea", "tan", "ate", "nat", "bat"]
输出: [ ["bat"], ["nat","tan"], ["ate","eat","tea"] ]

# 视频讲解

建议大家点击视频跳转到b站字母异位词分组 (opens new window)观看,体验更佳!

# 思路解析

本题的关键是找到字母异位词公共的特征,然后基于这个公共特征对所以的单词进行分类,这里介绍两种分类方法。

# 方法一 排序法

对每个单词拷贝一个副本,然后对单词的副本进行排序,排序后相等的单词存到同一个数组中。这里借用一个hash表,排序后的单词作为hash表的key。

对于strs = ["eat", "tea", "tan", "ate", "nat", "bat"],在hash表中的分布如下图:

# C++代码

class Solution {
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        vector<vector<string>> res;
        unordered_map<string, vector<string>> u_mapRes;
        for (auto& str : strs) {
            //对副本进行排序
            string key(str);
            sort(key.begin(), key.end());
            //存到hash表中
            u_mapRes[key].push_back(str);
        }
        for (auto& pair : u_mapRes) {
            res.push_back(pair.second);
        }
        return res;
    }
};

# java代码

class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        List<List<String>> res = new ArrayList<>();
        Map<String, List<String>> u_mapRes = new HashMap<>();
        for (String str : strs) {
            //对副本进行排序
            char[] charArray = str.toCharArray();
            Arrays.sort(charArray);
            String key = new String(charArray);
            //存到哈希表中
            if (!u_mapRes.containsKey(key)) {
                u_mapRes.put(key, new ArrayList<>());
            }
            u_mapRes.get(key).add(str);
        }
        for (List<String> group : u_mapRes.values()) {
            res.add(group);
        }
        return res;
    }
}

# python代码

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        res = []
        u_mapRes = defaultdict(list)
        for str in strs:
            #对副本进行排序
            key = ''.join(sorted(str))
            #存到哈希表中
            u_mapRes[key].append(str)
        for group in u_mapRes.values():
            res.append(group)
        return res

# 复杂度分析

时间复杂度: 排序需要O(nlogn),遍历数组需要O(n),所以整体的时间复杂度为O(nlogn),其中n是数组的长度。

空间复杂度: 需要借用一个hash表,最坏情况有n个key,所以空间复杂度为O(n),其中n是数组的长度。

# 方法二 字母统计法

方法一中对单词进行排序需要 O(nlogn) 的时间复杂度,这里我们可以通过对单词中的字母进行统计替代排序来优化。因为单词只包含小写字母,字母总共26个,可以采用一个由数字组成,长为26的字符串来统计每个单词中的字母数量,然后将这个字符串作为方法一中hash表的key。

可以通过任意小写字母字的assci码减去小写字母a的assci码,得到任意小写字母在字符串中的位置,字符串的索引和小写字母位置的对应关系如下图:

思考:能否使用哈希表或数组作为哈希表的key?需要做哪些额外操作?

# C++代码

class Solution {
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        vector<vector<string>> res;
        unordered_map<string, vector<string>> u_mapRes;
        for (auto& str : strs) {
            string count(26, '0');

            for (auto& c : str) {
                count[c - 'a'] += 1;
            }
            u_mapRes[count].push_back(str);
        }
        for (auto& pair : u_mapRes) {
            res.push_back(pair.second);
        }
        return res;
    }
};

# java代码

class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        List<List<String>> res = new ArrayList<>();
        Map<String, List<String>> u_mapRes = new HashMap<>();
        for (String str : strs) {
            int[] count = new int[26];
            for (char c : str.toCharArray()) {
                count[c - 'a']++;
            }
            String key = Arrays.toString(count);
            if (!u_mapRes.containsKey(key)) {
                u_mapRes.put(key, new ArrayList<>());
            }
            u_mapRes.get(key).add(str);
        }
        for (List<String> group : u_mapRes.values()) {
            res.add(group);
        }
        return res;
    }
}

# python代码

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        res = []
        u_mapRes = defaultdict(list)
        for str in strs:
            count = [0] * 26
            for c in str:
                count[ord(c) - ord('a')] += 1
            u_mapRes[tuple(count)].append(str)
        for group in u_mapRes.values():
            res.append(group)
        return res

# 复杂度分析

时间复杂度: 只需要遍历一遍数组统计字符,所以时间复杂度为O(n),其中n是数组的长度。

空间复杂度: 需要借用一个hash表,最坏情况有n个key,所以空间复杂度为O(n),其中n是数组的长度。

上次更新: 2024/07/13, 21:23:13
有效的字母异位词
找到字符串中所有字母异位词

← 有效的字母异位词 找到字符串中所有字母异位词→

Theme by Vdoing | Copyright © 2024-2024 华南溜达虎 | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式