nas-tools/web/backend/search_torrents.py

import os.path
import re

import log
from app.downloader import Downloader
from app.helper import DbHelper, ProgressHelper
from app.indexer import Indexer
from app.media import Media, DouBan
from app.media.meta import MetaInfo
from app.message import Message
from app.searcher import Searcher
from app.sites import Sites
from app.subscribe import Subscribe
from app.utils import StringUtils, Torrent
from app.utils.types import SearchType, IndexerType
from config import Config
from web.backend.web_utils import WebUtils

SEARCH_MEDIA_CACHE = {}
SEARCH_MEDIA_TYPE = {}


def search_medias_for_web(content, ident_flag=True, filters=None, tmdbid=None, media_type=None):
    """
    WEB资源搜索
    :param content: 关键字文本，可以包括 类型、标题、季、集、年份等信息，使用 空格分隔，也支持种子的命名格式
    :param ident_flag: 是否进行媒体信息识别
    :param filters: 其它过滤条件
    :param tmdbid: TMDBID或DB:豆瓣ID
    :param media_type: 媒体类型，配合tmdbid传入
    :return: 错误码，错误原因，成功时直接插入数据库
    """
    mtype, key_word, season_num, episode_num, year, content = StringUtils.get_keyword_from_string(content)
    if not key_word:
        log.info("【Web】%s 检索关键字有误！" % content)
        return -1, "%s 未识别到搜索关键字！" % content
    # 类型
    if media_type:
        mtype = media_type
    # 开始进度
    search_process = ProgressHelper()
    search_process.start('search')
    # 识别媒体
    media_info = None
    if ident_flag:

        # 有TMDBID或豆瓣ID
        if tmdbid:
            media_info = WebUtils.get_mediainfo_from_id(mtype=mtype, mediaid=tmdbid)
        else:
            # 按输入名称查
            media_info = Media().get_media_info(mtype=media_type or mtype,
                                                title=content)

        # 整合集
        if media_info:
            if season_num:
                media_info.begin_season = int(season_num)
            if episode_num:
                media_info.begin_episode = int(episode_num)

        if media_info and media_info.tmdb_info:
            # 查询到TMDB信息
            log.info(f"【Web】从TMDB中匹配到{media_info.type.value}：{media_info.get_title_string()}")
            # 查找的季
            if media_info.begin_season is None:
                search_season = None
            else:
                search_season = media_info.get_season_list()
            # 查找的集
            search_episode = media_info.get_episode_list()
            if search_episode and not search_season:
                search_season = [1]
            # 中文名
            if media_info.cn_name:
                search_cn_name = media_info.cn_name
            else:
                search_cn_name = media_info.title
            # 英文名
            search_en_name = None
            if media_info.en_name:
                search_en_name = media_info.en_name
            else:
                if media_info.original_language == "en":
                    search_en_name = media_info.original_title
                else:
                    en_title = Media().get_tmdb_en_title(media_info)
                    if en_title:
                        search_en_name = en_title
            # 两次搜索名称
            second_search_name = None
            if Config().get_config("laboratory").get("search_en_title"):
                if search_en_name:
                    first_search_name = search_en_name
                    second_search_name = search_cn_name
                else:
                    first_search_name = search_cn_name
            else:
                first_search_name = search_cn_name
                if search_en_name:
                    second_search_name = search_en_name

            filter_args = {"season": search_season,
                           "episode": search_episode,
                           "year": media_info.year,
                           "type": media_info.type}
        else:
            # 查询不到数据，使用快速搜索
            log.info(f"【Web】{content} 未从TMDB匹配到媒体信息，将使用快速搜索...")
            ident_flag = False
            media_info = None
            first_search_name = key_word
            second_search_name = None
            filter_args = {
                "season": season_num,
                "episode": episode_num,
                "year": year
            }
    # 快速搜索
    else:
        first_search_name = key_word
        second_search_name = None
        filter_args = {
            "season": season_num,
            "episode": episode_num,
            "year": year
        }
    # 整合高级查询条件
    if filters:
        filter_args.update(filters)
    # 开始检索
    log.info("【Web】开始检索 %s ..." % content)
    media_list = Searcher().search_medias(key_word=first_search_name,
                                          filter_args=filter_args,
                                          match_media=media_info,
                                          in_from=SearchType.WEB)
    # 使用第二名称重新搜索
    if ident_flag \
            and len(media_list) == 0 \
            and second_search_name \
            and second_search_name != first_search_name:
        search_process.start('search')
        search_process.update(ptype='search',
                              text="%s 未检索到资源,尝试通过 %s 重新检索 ..." % (first_search_name, second_search_name))
        log.info("【Searcher】%s 未检索到资源,尝试通过 %s 重新检索 ..." % (first_search_name, second_search_name))
        media_list = Searcher().search_medias(key_word=second_search_name,
                                              filter_args=filter_args,
                                              match_media=media_info,
                                              in_from=SearchType.WEB)
    # 清空缓存结果
    dbhepler = DbHelper()
    dbhepler.delete_all_search_torrents()
    # 结束进度
    search_process.end('search')
    if len(media_list) == 0:
        log.info("【Web】%s 未检索到任何资源" % content)
        return 1, "%s 未检索到任何资源" % content
    else:
        log.info("【Web】共检索到 %s 个有效资源" % len(media_list))
        # 插入数据库
        media_list = sorted(media_list, key=lambda x: "%s%s%s" % (str(x.res_order).rjust(3, '0'),
                                                                  str(x.site_order).rjust(3, '0'),
                                                                  str(x.seeders).rjust(10, '0')), reverse=True)
        dbhepler.insert_search_results(media_items=media_list,
                                       ident_flag=ident_flag,
                                       title=content)
        return 0, ""


def search_media_by_message(input_str, in_from: SearchType, user_id, user_name=None):
    """
    输入字符串，解析要求并进行资源检索
    :param input_str: 输入字符串，可以包括标题、年份、季、集的信息，使用空格隔开
    :param in_from: 搜索下载的请求来源
    :param user_id: 需要发送消息的，传入该参数，则只给对应用户发送交互消息
    :param user_name: 用户名称
    :return: 请求的资源是否全部下载完整、请求的文本对应识别出来的媒体信息、请求的资源如果是剧集，则返回下载后仍然缺失的季集信息
    """
    global SEARCH_MEDIA_TYPE
    global SEARCH_MEDIA_CACHE

    if not input_str:
        log.info("【Searcher】检索关键字有误！")
        return
    # 如果是数字，表示选择项
    if input_str.isdigit() and int(input_str) < 10:
        # 获取之前保存的可选项
        choose = int(input_str) - 1
        if not SEARCH_MEDIA_CACHE.get(user_id) or \
                choose < 0 or choose >= len(SEARCH_MEDIA_CACHE.get(user_id)):
            Message().send_channel_msg(channel=in_from,
                                       title="输入有误！",
                                       user_id=user_id)
            log.warn("【Web】错误的输入值：%s" % input_str)
            return
        media_info = SEARCH_MEDIA_CACHE[user_id][choose]
        if not SEARCH_MEDIA_TYPE.get(user_id) \
                or SEARCH_MEDIA_TYPE.get(user_id) == "SEARCH":
            # 如果是豆瓣数据，需要重新查询TMDB的数据
            if media_info.douban_id:
                _title = media_info.get_title_string()
                # 先从网页抓取（含TMDBID）
                doubaninfo = DouBan().get_media_detail_from_web(media_info.douban_id)
                if doubaninfo and doubaninfo.get("imdbid"):
                    tmdbid = Media().get_tmdbid_by_imdbid(doubaninfo.get("imdbid"))
                    if tmdbid:
                        # 按IMDBID查询TMDB
                        media_info.set_tmdb_info(Media().get_tmdb_info(mtype=media_info.type, tmdbid=tmdbid))
                        media_info.imdb_id = doubaninfo.get("imdbid")
                else:
                    search_episode = media_info.begin_episode
                    media_info = Media().get_media_info(title="%s %s" % (media_info.title, media_info.year),
                                                        mtype=media_info.type,
                                                        strict=True)
                    media_info.begin_episode = search_episode
                if not media_info or not media_info.tmdb_info:
                    Message().send_channel_msg(channel=in_from,
                                               title="%s 从TMDB查询不到媒体信息！" % _title,
                                               user_id=user_id)
                    return
            # 搜索
            __search_media(in_from=in_from,
                           media_info=media_info,
                           user_id=user_id,
                           user_name=user_name)
        else:
            # 订阅
            __rss_media(in_from=in_from,
                        media_info=media_info,
                        user_id=user_id,
                        user_name=user_name)
    # 接收到文本，开始查询可能的媒体信息供选择
    else:
        if input_str.startswith("订阅"):
            SEARCH_MEDIA_TYPE[user_id] = "SUBSCRIBE"
            input_str = re.sub(r"订阅[:：\s]*", "", input_str)
        elif input_str.startswith("http") or input_str.startswith("magnet:"):
            SEARCH_MEDIA_TYPE[user_id] = "DOWNLOAD"
        else:
            input_str = re.sub(r"(搜索|下载)[:：\s]*", "", input_str)
            SEARCH_MEDIA_TYPE[user_id] = "SEARCH"

        # 下载链接
        if SEARCH_MEDIA_TYPE[user_id] == "DOWNLOAD":
            if input_str.startswith("http"):
                # 检查是不是有这个站点
                site_info = Sites().get_sites(siteurl=input_str)
                # 偿试下载种子文件
                filepath, content, retmsg = Torrent().save_torrent_file(
                    url=input_str,
                    cookie=site_info.get("cookie"),
                    ua=site_info.get("ua"),
                    proxy=site_info.get("proxy")
                )
                # 下载种子出错
                if not content and retmsg:
                    Message().send_channel_msg(channel=in_from,
                                               title=retmsg,
                                               user_id=user_id)
                    return
                if isinstance(content, str):
                    # 磁力链
                    title = Torrent().get_magnet_title(content)
                    if title:
                        meta_info = Media().get_media_info(title=title)
                    else:
                        meta_info = MetaInfo(title="磁力链接")
                        meta_info.org_string = content
                    meta_info.set_torrent_info(
                        enclosure=content,
                        download_volume_factor=0,
                        upload_volume_factor=1
                    )
                else:
                    # 识别文件名
                    filename = os.path.basename(filepath)
                    # 识别
                    meta_info = Media().get_media_info(title=filename)
                    meta_info.set_torrent_info(
                        enclosure=input_str
                    )
            else:
                # 磁力链
                filepath = None
                title = Torrent().get_magnet_title(input_str)
                if title:
                    meta_info = Media().get_media_info(title=title)
                else:
                    meta_info = MetaInfo(title="磁力链接")
                    meta_info.org_string = input_str
                meta_info.set_torrent_info(
                    enclosure=input_str,
                    download_volume_factor=0,
                    upload_volume_factor=1
                )
            # 开始下载
            meta_info.user_name = user_name
            state, retmsg = Downloader().download(media_info=meta_info,
                                                  torrent_file=filepath)
            if state:
                Message().send_download_message(in_from=in_from,
                                                can_item=meta_info)
            else:
                Message().send_channel_msg(channel=in_from,
                                           title=f"添加下载失败，{retmsg}",
                                           user_id=user_id)

        # 搜索或订阅
        else:
            # 获取字符串中可能的RSS站点列表
            rss_sites, content = StringUtils.get_idlist_from_string(input_str,
                                                                    [{
                                                                        "id": site.get("name"),
                                                                        "name": site.get("name")
                                                                    } for site in Sites().get_sites(rss=True)])

            # 索引器类型
            indexer_type = Indexer().get_client_type()
            indexers = Indexer().get_indexers()

            # 获取字符串中可能的搜索站点列表
            if indexer_type == IndexerType.BUILTIN:
                content = input_str
                search_sites, _ = StringUtils.get_idlist_from_string(input_str, [{
                    "id": indexer.name,
                    "name": indexer.name
                } for indexer in indexers])
            else:
                search_sites, content = StringUtils.get_idlist_from_string(content, [{
                    "id": indexer.name,
                    "name": indexer.name
                } for indexer in indexers])

            # 获取字符串中可能的下载设置
            download_setting, content = StringUtils.get_idlist_from_string(content, [{
                "id": dl.get("id"),
                "name": dl.get("name")
            } for dl in Downloader().get_download_setting().values()])
            if download_setting:
                download_setting = download_setting[0]

            # 识别媒体信息，列出匹配到的所有媒体
            log.info("【Web】正在识别 %s 的媒体信息..." % content)
            if not content:
                Message().send_channel_msg(channel=in_from,
                                           title="无法识别搜索内容！",
                                           user_id=user_id)
                return

            # 搜索名称
            medias = WebUtils.search_media_infos(
                keyword=content
            )
            if not medias:
                # 查询不到媒体信息
                Message().send_channel_msg(channel=in_from,
                                           title="%s 查询不到媒体信息！" % content,
                                           user_id=user_id)
                return

            # 保存识别信息到临时结果中，由于消息长度限制只取前8条
            SEARCH_MEDIA_CACHE[user_id] = []
            for meta_info in medias[:8]:
                # 合并站点和下载设置信息
                meta_info.rss_sites = rss_sites
                meta_info.search_sites = search_sites
                meta_info.set_download_info(download_setting=download_setting)
                SEARCH_MEDIA_CACHE[user_id].append(meta_info)

            if 1 == len(SEARCH_MEDIA_CACHE[user_id]):
                # 只有一条数据，直接开始搜索
                media_info = SEARCH_MEDIA_CACHE[user_id][0]
                if not SEARCH_MEDIA_TYPE.get(user_id) \
                        or SEARCH_MEDIA_TYPE.get(user_id) == "SEARCH":
                    # 如果是豆瓣数据，需要重新查询TMDB的数据
                    if media_info.douban_id:
                        _title = media_info.get_title_string()
                        media_info = Media().get_media_info(title="%s %s" % (media_info.title, media_info.year),
                                                            mtype=media_info.type, strict=True)
                        if not media_info or not media_info.tmdb_info:
                            Message().send_channel_msg(channel=in_from,
                                                       title="%s 从TMDB查询不到媒体信息！" % _title,
                                                       user_id=user_id)
                            return
                    # 发送消息
                    Message().send_channel_msg(channel=in_from,
                                               title=media_info.get_title_vote_string(),
                                               text=media_info.get_overview_string(),
                                               image=media_info.get_message_image(),
                                               url=media_info.get_detail_url(),
                                               user_id=user_id)
                    # 开始搜索
                    __search_media(in_from=in_from,
                                   media_info=media_info,
                                   user_id=user_id,
                                   user_name=user_name)
                else:
                    # 添加订阅
                    __rss_media(in_from=in_from,
                                media_info=media_info,
                                user_id=user_id,
                                user_name=user_name)
            else:
                # 发送消息通知选择
                Message().send_channel_list_msg(channel=in_from,
                                                title="共找到%s条相关信息，请回复对应序号" % len(
                                                    SEARCH_MEDIA_CACHE[user_id]),
                                                medias=SEARCH_MEDIA_CACHE[user_id],
                                                user_id=user_id)


def __search_media(in_from, media_info, user_id, user_name=None):
    """
    开始搜索和发送消息
    """
    # 检查是否存在，电视剧返回不存在的集清单
    exist_flag, no_exists, messages = Downloader().check_exists_medias(meta_info=media_info)
    if messages:
        Message().send_channel_msg(channel=in_from,
                                   title="\n".join(messages),
                                   user_id=user_id)
    # 已经存在
    if exist_flag:
        return

    # 开始检索
    Message().send_channel_msg(channel=in_from,
                               title="开始检索 %s ..." % media_info.title,
                               user_id=user_id)
    search_result, no_exists, search_count, download_count = Searcher().search_one_media(media_info=media_info,
                                                                                         in_from=in_from,
                                                                                         no_exists=no_exists,
                                                                                         sites=media_info.search_sites,
                                                                                         user_name=user_name)
    # 没有搜索到数据
    if not search_count:
        Message().send_channel_msg(channel=in_from,
                                   title="%s 未搜索到任何资源" % media_info.title,
                                   user_id=user_id)
    else:
        # 搜索到了但是没开自动下载
        if download_count is None:
            Message().send_channel_msg(channel=in_from,
                                       title="%s 共搜索到%s个资源，点击选择下载" % (media_info.title, search_count),
                                       image=media_info.get_message_image(),
                                       url="search",
                                       user_id=user_id)
            return
        else:
            # 搜索到了但是没下载到数据
            if download_count == 0:
                Message().send_channel_msg(channel=in_from,
                                           title="%s 共搜索到%s个结果，但没有下载到任何资源" % (
                                               media_info.title, search_count),
                                           user_id=user_id)
    # 没有下载完成，且打开了自动添加订阅
    if not search_result and Config().get_config('pt').get('search_no_result_rss'):
        # 添加订阅
        __rss_media(in_from=in_from,
                    media_info=media_info,
                    user_id=user_id,
                    state='R',
                    user_name=user_name)


def __rss_media(in_from, media_info, user_id=None, state='D', user_name=None):
    """
    开始添加订阅和发送消息
    """
    # 添加订阅
    if media_info.douban_id:
        code, msg, media_info = Subscribe().add_rss_subscribe(mtype=media_info.type,
                                                              name=media_info.title,
                                                              year=media_info.year,
                                                              season=media_info.begin_season,
                                                              mediaid=f"DB:{media_info.douban_id}",
                                                              state=state,
                                                              rss_sites=media_info.rss_sites,
                                                              search_sites=media_info.search_sites)
    else:
        code, msg, media_info = Subscribe().add_rss_subscribe(mtype=media_info.type,
                                                              name=media_info.title,
                                                              year=media_info.year,
                                                              season=media_info.begin_season,
                                                              mediaid=media_info.tmdb_id,
                                                              state=state,
                                                              rss_sites=media_info.rss_sites,
                                                              search_sites=media_info.search_sites)
    if code == 0:
        log.info("【Web】%s %s 已添加订阅" % (media_info.type.value, media_info.get_title_string()))
        if in_from in Message().get_search_types():
            media_info.user_name = user_name
            Message().send_rss_success_message(in_from=in_from,
                                               media_info=media_info)
    else:
        if in_from in Message().get_search_types():
            log.info("【Web】%s 添加订阅失败：%s" % (media_info.title, msg))
            Message().send_channel_msg(channel=in_from,
                                       title="%s 添加订阅失败：%s" % (media_info.title, msg),
                                       user_id=user_id)