Longest Common Substring-II

1. Link

力扣

最长公共子序列(二)_牛客题霸_牛客网

2. 题目

给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列，返回 0 。

一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。

例如，"ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的公共子序列是这两个字符串所共同拥有的子序列。

示例 1：

输入：text1 = "abcde", text2 = "ace" 输出：3 解释：最长公共子序列是 "ace" ，它的长度为 3 。示例 2：

输入：text1 = "abc", text2 = "abc" 输出：3 解释：最长公共子序列是 "abc" ，它的长度为 3 。

来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/longest-common-subsequence 著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。

3. 思路

思路： 2D- DP
row = str1, col = str2, dp[i][j] 为str1[:i] 和str2[:j] substring的最大公共子序列的长度，这是一个子问题
遍历str1 和str2的每一个char 进行对比，如果 str1[i] == str2[j] , 那么dp[i][j] = dp[i-1][j-1] + 1等于不考虑当前相同的char之前的substring的最长公共子序列的长度 + 当前相同的char 1
如果str1[i] != str2[j], 就直接简单地把dp[i-1][j-1]， dp[i-1][j]， dp[i][j-1]三种情况逐一对比找最优的情况传到下一个情况, 即考虑一下三种情况的最优解
1. 考虑str1[i] char 不考虑 str2[j] char
2. 考虑str2[j] char 不考虑 str1[i] char
3. str1[i], str2[j] char 都不考虑
Time: O(n^2), Space: O(n^2)

4. Coding

class Solution:
    def longestCommonSubsequence(self, text1: str, text2: str) -> int:
        #
        #
        #idea: 2D- DP
        # col = str1, row = str2
        # dp[i][j] = str1[:i] 和str2[:j] 的最长公共子序列的长度
        #   str2\str1   ""  s1[0]   s1[1] ....s1[n]
        #   ""
        #   s2[0]
        #   s2[1]
        #   ..
        #   s2[m]
        if not text1  or not text2:
            return 0
        max_len =0
        dp = [[0]*(len(text1)+1) for i in range(len(text2)+1)]
        for i in range(1, len(text2)+1):
            for j in range(1, len(text1)+1):
                
                if text1[j-1] == text2[i-1] :
                    # 把前面连续的substring的长度加上现在新的char的长度
                    dp[i][j] = dp[i-1][j-1] + 1
                else:
                    # 把前面遇到最大的common substring长度传到后面去
                    dp[i][j] = max(dp[i-1][j-1], dp[i-1][j],dp[i][j-1])
                max_len = max(max_len, dp[i][j])
        return dp[i][j]

返回最长公共字符串的写法: 从dp矩阵结尾反向寻找str1[i] == str2[j]的字符，每次往最大的dp[i][j]方向进行缩小

class Solution:
    def LCS(self , str1 , str2 ):
        # write code here
        # test case:
        # s1 = "ABCDBD"  s2 = "BCE"
        # dp table
        #    A   B   C   D  B  D
        # B  0   1   0   0  1  0
        # C  0   0   1   0  0  0
        # E  0   0   0   0  0  0
        #
        #
        #s1 = "1AB3CD4BD5"  s2 = "3B45CE"
        # dp table
        #   1   A   B   3  C   D  4  B  D   5
        # 3 0   0   0   1  0   0  0  0  0   0
        # B 0   0   1   0  0   0  0  1  0   0
        # 4 0   0    0  0   0  0  1  0  0   0
        # 5 0  0    0   0  0   0  0  0  0   1
        # C 0  0   0    0   1  0  0   0 0   0
        # E
        #
        #
        #
        # 可以发现如果是连续的substring那么table里面就有连续的斜线
        # 然后我们要找的就是最长的斜线的位置
        # idea:
        # 1. 搭建table， dp table的cell代表以当前的str1 第i个位置， str2第j个位置 结尾的
        #  common substring的长度
        # 2. 我们只要找到最长的长度，以及结尾的位置就可以找到longest common substring
        # idea
        #  1. iterate str1
        #     iterate str 2 
        #       if str1[i] == str2[j]: label tb[i][j] = tbl[i-1][j-1] +1
        #        update max len and  end of index in str1
        #     return str1[end- max_len+1: end+1]
        
        if not str1 or not str2:
            return "-1"
        dp = [[0]*(len(str2)+1) for i in range(len(str1)+1)]
        max_len = 0
        idx = 0
        for i in range(1,len(str1)+1):
            for j in range(1,len(str2)+1):
                if str1[i-1] == str2[j-1]:
                    dp[i][j] = dp[i-1][j-1] + 1
                else:
                    dp[i][j] = max(dp[i][j-1], dp[i-1][j])
        i = len(str1)
        j = len(str2)
        res = []
        while i >=0 and j >=0:
            if str1[i-1] == str2[j-1]:
                res.insert(0, str2[j-1])
                i -= 1 
                j -= 1
            else:
                if dp[i-1][j] > dp[i][j-1]:
                    i -=1
                else:
                    j -= 1
        res = "".join(res)
        if not res:
            return "-1"
        return res

PreviousLongest Common Substring NextminEditCost

Last updated 4 years ago

Was this helpful?