Область техники, к которой относится изобретение
Настоящее изобретение относится к технологии для воспроизведения стереоскопического, т.е. трехмерного (3D) видео, и в частности, к структуре потоковых данных на носителе записи.
Уровень техники
В последние годы, общий интерес к трехмерному видео возрастает. Например, аттракционы парков развлечений, которые включают трехмерные видеоизображения, являются популярными. Кроме того, по всей стране число кинотеатров, показывающих трехмерные фильмы, увеличивается. Наряду с этим повышением интереса к трехмерному видео, также развиваются технологические разработки, которые обеспечивают воспроизведение трехмерных видеоизображений дома. Имеется спрос на такие технологии, чтобы сохранять трехмерное видеосодержимое на портативном носителе записи, таком как оптический диск, при сохранении высокого качества изображений для трехмерного видеосодержимого. Кроме того, имеется спрос на совместимость носителя записи с устройством двумерного (2D) воспроизведения. Таким образом, предпочтительно, чтобы устройство двумерного воспроизведения могло воспроизводить двумерные видеоизображения, а устройство трехмерного воспроизведения могло воспроизводить трехмерные видеоизображения из одинакового трехмерного видеосодержимого, записанного на носитель записи. Здесь, "устройство двумерного воспроизведения" означает традиционное устройство воспроизведения, которое может воспроизводить только моноскопические видеоизображения, т.е. двумерные видеоизображения, в то время как "устройство трехмерного воспроизведения" означает устройство воспроизведения, которое может воспроизводить трехмерные видеоизображения. Следует отметить, что в настоящем описании предполагается, что устройство трехмерного воспроизведения также может воспроизводить традиционные двумерные видеоизображения.
Фиг. 109 является схематичным представлением, иллюстрирующим механизм для обеспечения совместимости оптического диска, сохраняющего трехмерные видеоизображения, с устройствами двумерного воспроизведения (см. для примера патентный документ 1). Оптический диск PDS сохраняет два типа видеопотоков. Один - это двумерный/для просмотра левым глазом видеопоток, а другой - это видеопоток для просмотра правым глазом. "Двумерный/для просмотра левым глазом видеопоток" представляет двумерное видеоизображение, которое должно показываться для левого глаза зрителя во время трехмерного воспроизведения, т.е. "вид для просмотра левым глазом". Во время двумерного воспроизведения этот поток составляет двумерное видеоизображение. "Видеопоток для просмотра правым глазом" представляет двумерное видеоизображение, которое должно показываться для правого глаза зрителя во время трехмерного воспроизведения, т.е. "вид для просмотра правым глазом". Видеопотоки для просмотра левым и правым глазом имеют одинаковую частоту кадров, но различные времена представления, сдвинутые друг от друга наполовину периода кадра. Например, когда частота кадров каждого видеопотока составляет 24 кадра в секунду, кадры двумерного/для просмотра левым глазом видеопоток и видеопотока для просмотра правым глазом поочередно отображаются каждые 1/48 секунды.
Как показано на фиг. 109, видеопотоки для просмотра левым глазом и правым глазом разделяются на множество экстентов EX1A-C и EX2A-C, соответственно, на оптическом диске PDS. Каждый экстент содержит, по меньшей мере, одну группу изображений (GOP), причем GOP считываются совместно посредством накопителя на оптических дисках. В дальнейшем в этом документе, экстенты, принадлежащие двумерному/для просмотра левым глазом видеопотоку, упоминаются как "двумерные/для просмотра левым глазом экстенты", а экстенты, принадлежащие видеопотоку для просмотра правым глазом, упоминаются как "экстенты для просмотра правым глазом". Двумерные/для просмотра левым глазом экстенты EX1A-C и экстенты EX2A-C для просмотра правым глазом поочередно компонуются на дорожке TRC оптического диска PDS. Каждые два смежных экстента EX1A+EX2A, EX1B+EX2B и EX1C+EX2C имеют идентичную продолжительность воспроизведения. Данная компоновка экстентов называется "перемеженной компоновкой". Группа экстентов, записанная в перемеженной компоновке на носитель записи, используется как при воспроизведении трехмерного видео, так и при воспроизведении двумерных видеоизображений, как описано ниже.
Из экстентов, записанных на оптическом диске PDS, устройство PL2 двумерного воспроизведения инструктирует накопителю DD2 на оптических дисках считывать только двумерные/для просмотра левым глазом экстенты EX1A-C последовательно с начала при пропуске считывания экстентов EX2A-C для просмотра правым глазом. Кроме того, декодер VDC изображений последовательно декодирует экстенты, считанные посредством накопителя DD2 на оптических дисках, в видеокадр VFL. Таким образом, дисплейное устройство DS2 отображает только виды для просмотра левым глазом, и зрители могут просматривать обычные двумерные видеоизображения.
Устройство PL3 трехмерного воспроизведения инструктирует накопителю DD3 на оптических дисках поочередно считывать двумерные/для просмотра левым глазом экстенты и экстенты для просмотра правым глазом с оптического диска PDS. Когда выражаются как коды, экстенты считываются в порядке EX1A, EX2A, EX1B, EX2B, EX1C и EX2C. Кроме того, из считанных экстентов, экстенты, принадлежащие двумерному/для просмотра левым глазом видеопотоку, предоставляются в левый видеодекодер VDL, тогда как экстенты, принадлежащие видеопотоку для просмотра правым глазом, предоставляются в правый видеодекодер VDR. Видеодекодеры VDL и VDR поочередно декодируют каждый видеопоток в видеокадры VFL и VFR, соответственно. Как результат, виды для просмотра левым глазом и виды для просмотра правым глазом поочередно отображаются на дисплейном устройстве DS3. Синхронно с переключением видов посредством дисплейного устройства DS3 очки SHG с затвором инструктируют левым и правым линзам становиться непрозрачными поочередно. Следовательно, зритель с надетыми очками SHG с затвором видит виды, отображаемые посредством дисплейного устройства DS3, как трехмерные видеоизображения.
Когда трехмерное видеосодержимое сохраняется на любом носителе записи, не только на оптическом диске, вышеописанная перемеженная компоновка экстентов используется. Носитель записи тем самым может использоваться для воспроизведения двумерных видеоизображений и трехмерных видеоизображений.
Список библиографических ссылок
Патентные документы
Патентный документ 1. Патентная публикация (Япония) номер 3935507
Сущность изобретения
Техническая проблема
Общее видеосодержимое включает в себя, в дополнение к видеопотоку, один или более графических потоков, представляющих графические изображения, такие как субтитры и интерактивные экраны. Когда видеоизображения воспроизводятся из трехмерного видеосодержимого, графические изображения также воспроизводятся в трех измерениях. Технологии их воспроизведения в трех измерениях включают в себя режим 2 плоскостей и режим 1 плоскости+смещения. Трехмерное видеосодержимое в режиме 2 плоскостей включает в себя пару графических потоков, отдельно представляющих графические изображения для просмотра левым глазом и для просмотра правым глазом. Устройство воспроизведения в режиме 2 плоскостей формирует отдельную графическую плоскость для просмотра левым глазом и правым глазом из графических потоков. Трехмерное видеосодержимое в режиме 1 плоскости+смещения включает в себя графический поток, представляющий двумерные графические изображения, и информацию смещения, предусмотренную для графического потока. Устройство воспроизведения в режиме 1 плоскости+смещения сначала формирует одну графическую плоскость из графического потока и затем предоставляет горизонтальное смещение в графической плоскости в соответствии с информацией смещения. Пара графических плоскостей для просмотра левым глазом и правым глазом тем самым формируется из графического потока. В любом режиме графические изображения для просмотра левым глазом и правым глазом поочередно отображаются на экране дисплейного устройства. Как результат, зрители воспринимают графические изображения как трехмерные изображения.
Если графический поток и информация смещения содержатся в отдельных файлах трехмерного видеосодержимого, устройство воспроизведения в режиме 1 плоскости+смещения обрабатывает эти файлы отдельно в соответствующие фрагменты данных и использует фрагменты данных для того, чтобы формировать пару графических изображений для просмотра левым глазом и правым глазом. Следует отметить, что графические изображения и информация смещения, в общем, изменяются в периодах кадра. Тем не менее, считывание и анализ файла, сохраняющего информацию смещения, каждый раз, когда кадр отображается, имеет риск того, что "процесс не выполняется вовремя, и изображения не могут отображаться корректно".
Соответственно, для безошибочной синхронизации процесса с периодом кадра необходимо разворачивать информацию смещения в запоминающем устройстве заранее. В этом случае, емкость встроенного запоминающего устройства, в котором должен быть развернут файл, сохраняющий информацию смещения, обязательно должна быть большой, поскольку общее количество информации смещения в расчете на графический поток является большим. Кроме того, когда множество графических изображений включается в одну сцену, встроенное запоминающее устройство должно иметь еще большую емкость. Таким образом, включение графического потока и информации смещения как отдельных файлов в трехмерное видеосодержимое исключает дополнительное снижение емкости встроенного запоминающего устройства.
Чтобы разрешать вышеописанную проблему, информация смещения содержится, например, в видеопотоке с интервалами в GOP. Это дает возможность декодеру в устройстве воспроизведения извлекать информацию смещения из видеопотока в ходе декодирования видеопотока. Как результат, устройство воспроизведения может безусловно поддерживать соответствие между графическим потоком и информацией смещения. Помимо этого, например, встроенное запоминающее устройство должно иметь только емкость, достаточную для того, чтобы разворачивать информацию смещения в расчете на GOP. Это позволяет легко достигать как поддержки трехмерного видеосодержимого с различными графическими потоками, так и дополнительного снижения емкости встроенного запоминающего устройства.
Здесь, различные средства возможны в качестве конкретного средства, используемого посредством декодера в устройстве воспроизведения, чтобы реализовывать функцию, чтобы извлекать информацию смещения из видеопотоков, к примеру, средство для включения функции в аппаратные средства, выделенные для декодирования видеопотоков, и средство для реализации функции посредством других аппаратных средств или программного обеспечения. Тем не менее, не является предпочтительным то, чтобы варьировать структуры данных видеопотоков и информации смещения между этими средствами.
Цель настоящего изобретения заключается в том, чтобы разрешать вышеуказанные проблемы, в частности, предоставлять носитель записи, в котором видеопоток и информация смещения совместно записываются в структуре данных, совместно применимой в различных режимах реализации функции, которая состоит в том, чтобы извлекать информацию смещения из видеопотока, в устройство воспроизведения.
Решение проблемы
На носителе записи согласно настоящему изобретению
записываются видеопоток для воспроизведения основного вида, видеопоток для воспроизведения подвида и графический поток. Видеопоток для воспроизведения основного вида включает в себя изображения для воспроизведения основного вида, составляющие основные виды стереоскопических видеоизображений. Видеопоток для воспроизведения подвида включает в себя изображения для воспроизведения подвида и метаданные, причем изображения для воспроизведения подвида составляют подвиды стереоскопических видеоизображений. Графический поток включает в себя графические данные, составляющие моноскопические графические изображения. Изображения для воспроизведения основного вида являются визуализированными (выполненными с помощью рендеринга) на видеоплоскости для воспроизведения основного вида в ходе воспроизведения. Изображения для воспроизведения подвида являются визуализированными на видеоплоскости для воспроизведения подвида в ходе воспроизведения. Графические данные являются визуализированными на графической плоскости в ходе
воспроизведения. Метаданные предоставляются в каждой группе изображений (GOP), составляющей видеопоток для воспроизведения подвида, и включают в себя информацию смещения. Информация смещения является управляющей информацией, указывающей управление смещением для множества изображений, составляющих GOP. Управление смещением является процессом для того, чтобы предоставлять смещение влево и смещение вправо для горизонтальных координат в графической плоскости, чтобы формировать пару графических плоскостей, и затем комбинировать пару графических плоскостей отдельно с видеоплоскостью для воспроизведения основного вида и видеоплоскостью для воспроизведения подвида. Видеопоток для воспроизведения подвида мультиплексируется в транспортном потоке (TS). TS-пакеты, составляющие TS, имеют заголовок, включающий в себя флаг TS-приоритета, который указывает приоритет TS-пакета. TS-пакеты, содержащие метаданные, имеют значение флага TS-приоритета, отличное от TS-пакетов, содержащих изображения для воспроизведения подвида.
Преимущества изобретения
Носитель записи согласно настоящему изобретению предоставляет возможность модулю декодирования устройства воспроизведения разделять TS-пакеты, содержащие метаданные, и TS-пакеты, содержащие изображения для воспроизведения подвида, в соответствии со значениями флагов TS-приоритета. Соответственно, модуль декодирования может содержать отдельные функциональные модули; один для извлечения информации смещения из TS-пакетов, содержащих метаданные, и другой для декодирования TS-пакетов, содержащих изображения для воспроизведения подвида, в несжатые изображения. В этом случае, конкретные конфигурации этих функциональных модулей могут быть созданы независимо друг от друга. С другой стороны, модуль декодирования, в котором интегрируются функциональные модули, предоставляет возможность интегрированному функциональному модулю обрабатывать все TS-пакеты, содержащие видеопоток для воспроизведения подвида, независимо от значений флагов TS-приоритета. Таким образом, носитель записи согласно настоящему изобретению предоставляет возможность совместной записи видеопотока и информации смещения в структуре данных, совместно применимой в различных режимах реализации функции, которая состоит в том, чтобы извлекать информацию смещения из видеопотока, в устройство воспроизведения.
Краткое описание чертежей
Фиг. 1 является схематичным представлением, показывающим систему домашнего кинотеатра, которая использует носитель записи согласно варианту осуществления 1 настоящего изобретения.
Фиг. 2 является схематичным представлением, показывающим структуру данных BD-ROM-диска 101, показанного на фиг. 1.
Фиг. 3A и 3B являются списками элементарных потоков, мультиплексированных в основном TS и суб-TS на BD-ROM-диске, соответственно.
Фиг. 4 является схематичным представлением, показывающим компоновку TS-пакетов в мультиплексированных потоковых данных 400.
Фиг. 5A является принципиальной схемой, показывающей структуру данных TS-заголовка 501H; фиг. 5B является принципиальной схемой, показывающей формат последовательности TS-пакетов 501, составляющих мультиплексированные потоковые данные; фиг. 5C является принципиальной схемой, показывающей формирование последовательности исходных пакетов 502, состоящей из последовательности TS-пакетов для мультиплексированных потоковых данных; а фиг. 5D является принципиальной схемой группы секторов, в которую последовательно записывается последовательность исходных пакетов 502, в области тома BD-ROM-диска.
Фиг. 6 является принципиальной схемой, показывающей структуру данных PG-потока 600.
Фиг. 7 является схематичным представлением, показывающим изображения в видеопотоке 701 для воспроизведения базового вида и в видеопотоке 902 для просмотра правым глазом в порядке времени представления.
Фиг. 8 является схематичным представлением, показывающим подробности относительно структуры данных видеопотока 800.
Фиг. 9 является схематичным представлением, показывающим подробности относительно способа для сохранения видеопотока 901 в последовательность 902 PES-пакетов.
Фиг. 10 является схематичным представлением, показывающим соответствие между PTS и DTS, назначенными каждому изображению в видеопотоке 1001 для воспроизведения базового вида и в видеопотоке 1002 для воспроизведения зависимого вида.
Фиг. 11 является схематичным представлением, показывающим структуру данных для метаданных 1110 смещения, включенных в видеопоток 1100 для воспроизведения зависимого вида.
Фиг. 12 является таблицей, показывающей синтаксис этих метаданных 1110 смещения, показанных на фиг. 11.
Фиг. 13A и 13B являются схематичными представлениями, показывающими управление смещениями для PG-плоскости 1310 и IG-плоскости 1320, соответственно, а фиг. 13C является схематичным представлением, показывающим трехмерные графические изображения, которые зритель 1330 должен воспринимать из двумерных графических изображений, представленных посредством графических плоскостей, показанных на фиг. 13A и 13B.
Фиг. 14A и 14B являются графиками, показывающими примеры последовательностей смещений, а фиг. 14C является схематичным представлением, показывающим трехмерные графические изображения, воспроизводимые в соответствии с последовательностями смещений, показанными на фиг. 14A и 14B.
Фиг. 15 является принципиальной схемой, показывающей PES-пакет 1510, сохраняющий VAU #1 1500 в видеопотоке для воспроизведения зависимого вида, и последовательности 1520 TS-пакетов, сформированных из PES-пакета 1510.
Фиг. 16 является принципиальной схемой, показывающей последовательность TS-пакетов 1620, при этом TS-пакеты, принадлежащие первой группе 1521 и второй группе 1522, показанных на фиг. 15, указывают одно значение TS-приоритета.
Фиг. 17A является принципиальной схемой, показывающей структуру данных информации 1750 переключения декодирования; а фиг. 17B и 17C являются принципиальными схемами, показывающими последовательности счетчиков 1710, 1720, 1730 и 1740 декодирования, выделяемых каждому изображению в видеопотоке 1701 для воспроизведения базового вида и видеопотоке 1702 для воспроизведения зависимого вида.
Фиг. 18 является схематичным представлением, показывающим структуру данных PMT 1810.
Фиг. 19 является принципиальной схемой, показывающей физическую компоновку мультиплексированных потоковых данных на BD-ROM-диске.
Фиг. 20A является схематичным представлением, показывающим компоновку основного TS 2001 и суб-TS 2002, записанных отдельно и последовательно на BD-ROM-диске; фиг. 20B является схематичным представлением, показывающим компоновку блоков D[0], D[1], D[2], ..., данных для воспроизведения зависимого вида и блоков B[0], B[1], B[2], ..., данных для воспроизведения базового вида, записанных поочередно на BD-ROM-диске 101 согласно варианту осуществления 1 настоящего изобретения, фиг. 20C и 20D являются схематичными представлениями, показывающими примеры ATC-времен экстента для группы D[n] блоков данных для воспроизведения зависимого вида и группы B[n] блоков данных для воспроизведения базового вида, записанных в перемеженной компоновке (n=0, 1, 2).
Фиг. 21 является принципиальной схемой, показывающей путь 2101, 2102 воспроизведения в режиме двумерного воспроизведения и L/R-режиме для группы 1901-1903 блоков экстентов.
Фиг. 22 является принципиальной схемой, показывающей структуру данных файла 231 информации о двумерных клипах (01000.clpi).
Фиг. 23A является схематичным представлением, показывающим структуру данных карты 2230 вхождений; фиг. 23B является схематичным представлением, показывающим исходные пакеты в группе 2310 исходных пакетов, принадлежащей файлу 2D 241, которые ассоциированы с каждым EP_ID 2305 посредством карты 2230 вхождений, а фиг. 23C является схематичным представлением, показывающим группу D[n], B[n] блоков данных (n=0, 1, 2, 3, ...) на BD-ROM-диске 101, соответствующую группе 2310 исходных пакетов.
Фиг. 24A является принципиальной схемой, показывающей структуру данных начальных точек 2242 экстентов; фиг. 24B является принципиальной схемой, показывающей структуру данных начальных точек 2420 экстентов, включенных в файл 232 информации о клипах для воспроизведения зависимого вида (02000.clpi); фиг. 24C является принципиальной схемой, представляющей блоки B[0], B[1], B[2], ..., данных для воспроизведения базового вида, извлеченные из файла SS 244A посредством устройства 102 воспроизведения в режиме трехмерного воспроизведения; фиг. 24D является принципиальной схемой, показывающей соответствие между экстентами EXT2[0], EXT2[1], ..., для воспроизведения зависимого вида, принадлежащими файлу DEP (02000.m2ts) 242, и SPN 2422, показанными посредством начальных точек 2420 экстентов; а фиг. 24E является принципиальной схемой, показывающей соответствие между экстентом SS EXTSS[0], принадлежащим файлу SS 244A, и блоком экстентов на BD-ROM-диске.
Фиг. 25 является принципиальной схемой, показывающей соответствие между одним блоком 2500 экстентов, записанным на BD-ROM-диске, и каждой из групп блоков экстентов в файле 2D 2510, файле base 2511, файле DEP 2512 и файле SS 2520.
Фиг. 26 является схематичным представлением, показывающим пример точек входа, заданных в видеопотоке 2610 для воспроизведения базового вида и в видеопотоке 2620 для воспроизведения зависимого вида.
Фиг. 27 является схематичным представлением, показывающим структуру данных файла списков для двумерного воспроизведения.
Фиг. 28 является принципиальной схемой, показывающей структуру данных PI #N, показанного на фиг. 27.
Фиг. 29A и 29B являются схематичными представлениями, показывающими соответствие между двумя секциями 2901 и 2902 воспроизведения, которые должны соединяться, когда CC равно "5" или "6".
Фиг. 30 является принципиальной схемой, показывающей соответствие между PTS, указываемыми посредством файла 221 списков для двумерного воспроизведения (00001.mpls), и секциями, воспроизводимыми из файла 2D (01000.m2ts) 241.
Фиг. 31 является схематичным представлением, показывающим структуру данных файла списков для трехмерного воспроизведения.
Фиг. 32 является схематичным представлением, показывающим STN-таблицу 3205, включенную в основной путь 3101 файла списков для трехмерного воспроизведения, показанного на фиг. 31.
Фиг. 33 является схематичным представлением, показывающим структуру данных STN-таблицы SS 3130, показанной на фиг. 31.
Фиг. 34 является схематичным представлением, показывающим соответствие между PTS, указываемыми посредством файла 222 списков для трехмерного воспроизведения (00002.mpls), и секциями, воспроизводимыми из файла SS (01000.ssif) 244A.
Фиг. 35 является схематичным представлением, показывающим структуру данных индексного файла (index.bdmv) 211, показанного на фиг. 2.
Фиг. 36 является блок-схемой последовательности операций способа обработки, посредством которого устройство 102 воспроизведения, показанное на фиг. 1, выбирает файл списков воспроизведения для воспроизведения посредством использования шести типов процессов определения.
Фиг. 37 является функциональной блок-схемой устройства 3700 двумерного воспроизведения.
Фиг. 38 является списком системных параметров (SPRM), сохраненных в модуле 3736 хранения переменных проигрывателя, показанном на фиг. 37.
Фиг. 39 является блок-схемой последовательности операций способа обработки воспроизведения по списку для двумерного воспроизведения посредством модуля 3735 управления воспроизведением, показанного на фиг. 37.
Фиг. 40 является функциональной блок-схемой декодера 3725 системных целевых объектов, показанного на фиг. 37.
Фиг. 41A является блок-схемой последовательности операций способа обработки, посредством которого PG-декодер 4072, показанный на фиг. 40, декодирует графический объект из одной записи данных в PG-потоке; а фиг. 41B-41E являются принципиальными схемами, показывающими изменение графического объекта по мере того, как обработка выполняется.
Фиг. 42 является функциональной блок-схемой устройства 4200 трехмерного воспроизведения.
Фиг. 43 является таблицей, показывающей структуру данных SPRM(27) и SPRM(28), сохраненных в модуле 4236 хранения переменных проигрывателя, показанном на фиг. 42.
Фиг. 44 является блок-схемой последовательности операций способа обработки воспроизведения по списку для трехмерного воспроизведения посредством модуля 4235 управления воспроизведением, показанного на фиг. 42.
Фиг. 45 является функциональной блок-схемой декодера 4225 системных целевых объектов, показанного на фиг. 42, который реализует функцию, чтобы извлекать метаданные смещения посредством использования первого средства.
Фиг. 46 является функциональной блок-схемой системы обработки видеопотоков в декодере 4225 системных целевых объектов, показанном на фиг. 42, которая реализует функцию, чтобы извлекать метаданные смещения посредством использования второго средства.
Фиг. 47 является функциональной блок-схемой сумматора 4226 плоскостей, показанного на фиг. 42.
Фиг. 48 является блок-схемой последовательности операций способа управления смещением посредством модулей 4731-4734 кадрирования, показанных на фиг. 47.
Фиг. 49B является принципиальной схемой, показывающей данные GP PG-плоскости, для которых второй модуль 4732 кадрирования должен предоставлять управление смещением; а фиг. 49A и 49C являются принципиальными схемами, показывающими данные RPG PG-плоскости, для которых предоставлено смещение вправо, и данные LPG PG-плоскости, для которых предоставлено смещение влево.
Фиг. 50 является принципиальной схемой, показывающей PES-пакет 5010, сохраняющий VAU #1 5000 в видеопотоке для воспроизведения зависимого вида, и последовательности 5020 TS-пакетов, сформированных из PES-пакета 5010.
Фиг. 51 является функциональной блок-схемой, показывающей систему обработки видеопотоков в декодере 5125 системных целевых объектов, которая извлекает метаданные смещения из последовательности 5020 TS-пакетов, показанной на фиг. 50.
Фиг. 52A является схематичным представлением, показывающим структуру данных для метаданных 5200 смещения, которые используют функцию выполнения, фиг. 52B является графиком, показывающим типы элементов в функции выполнения, а фиг. 52C является графиком, показывающим значения смещения, вычисляемые посредством устройства трехмерного воспроизведения из идентификаторов последовательностей смещений=0, 1, 2, показанных на фиг. 52A.
Фиг. 53 является схематичным представлением, показывающим (i) структуру данных файла 5300 списков для трехмерного воспроизведения, который включает в себя множество подпутей, и (ii) структуру данных файла 2D 5310 и двух файлов DEP 5321 и 5322, к которым обращается файл 5300 списков для трехмерного воспроизведения.
Фиг. 54 является принципиальной схемой, показывающей STN-таблицу 5400, в которой два или более значений регулирования смещения задаются для одного фрагмента потоковых данных.
Фиг. 55A-55C являются принципиальными схемами, показывающими параллаксы PRA, PRB и PRC между видами для просмотра левым и правым глазом, отображаемыми на 32-дюймовом экране SCA, 50-дюймовом экране SCB и 100-дюймовом экране SCC, соответственно.
Фиг. 56A является принципиальной схемой, показывающей таблицу соответствия между размерами экрана и выходными значениями регулирования смещения; а фиг. 56B является графиком, представляющим функцию между размерами экрана и выходными значениями регулирования смещения.
Фиг. 57 является блок-схемой, показывающей компоненты устройства трехмерного воспроизведения, требуемые для регулирования выходного смещения.
Фиг. 58A является схематичным представлением, показывающим структуру данных видеопотока 5800 для воспроизведения зависимого вида, представляющего только неподвижные изображения, а фиг. 58B является схематичным представлением, показывающим последовательность 5821 видеоплоскостей для просмотра левым глазом, последовательность 5822 видеоплоскостей для просмотра правым глазом и последовательность 5830 графических плоскостей, которые воспроизводятся в соответствии со списком для трехмерного воспроизведения.
Фиг. 59 является блок-схемой дисплейного устройства 103, которое выполняет обработку для компенсации несовмещения между видами для просмотра левым и правым глазом.
Фиг. 60A является видом сверху, схематично показывающим горизонтальные углы обзора HAL и HAR для пары видеокамер CML и CMR, снимающих трехмерные видеоизображения; фиг. 60B и 60C являются принципиальными схемами, показывающими вид LV для просмотра левым глазом, снимаемый посредством левой видеокамеры CML, и вид RV для просмотра правым глазом, захватываемый посредством правой видеокамеры CMR, соответственно; а фиг. 60D и 60E являются принципиальными схемами, соответственно, показывающими вид LV для просмотра левым глазом, представленный посредством обработанной левой видеоплоскости, и вид RV для просмотра правым глазом, представленный посредством обработанной правой видеоплоскости.
Фиг. 61A является видом сверху, схематично показывающим вертикальные углы обзора VAL и VAR для пары видеокамер CML и CMR, снимающих трехмерные видеоизображения; фиг. 61B является принципиальной схемой, показывающей вид LV для просмотра левым глазом, снимаемый посредством левой видеокамеры CML, и вид RV для просмотра правым глазом, захватываемый посредством правой видеокамеры CMR; а фиг. 61C является принципиальной схемой, показывающей вид LV для просмотра левым глазом, представленный посредством обработанной левой видеоплоскости, и вид RV для просмотра правым глазом, представленный посредством обработанной правой видеоплоскости.
Фиг. 62A является принципиальной схемой, показывающей пример графических изображений, представленных посредством графической плоскости GPL; фиг. 62B и 62C являются принципиальными схемами, соответственно, показывающими процессы предоставления смещения вправо и влево для графической плоскости GPL; и фиг. 62D и 62E являются принципиальными схемами, показывающими графические изображения, представленные посредством графических плоскостей GP1 и GP2, со смещениями вправо и влево, соответственно.
Фиг. 63 является принципиальной схемой, показывающей условие, касающееся компоновки графических элементов для графических плоскостей, воспроизводимых из PG-потока или IG-потока на BD-ROM-диске, и для графической плоскости, сформированной посредством устройства 102 воспроизведения.
Фиг. 64A1 и 64A2 являются принципиальными схемами, показывающими идентичный экран при отображении в формате "почтовый ящик"; фиг. 64B и 64C являются принципиальными схемами, показывающими экраны, на которых плоскость первичного видео содержит смещения вверх и вниз в 131 пиксел, соответственно; а фиг. 64D является принципиальной схемой, показывающей экран, на котором плоскость первичного видео содержит смещение вверх в 51 пиксел.
Фиг. 65 является функциональной блок-схемой, показывающей структуру устройства воспроизведения, требуемую для сдвига видео.
Фиг. 66A является таблицей, показывающей структуры данных SPRM(32) и SPRM(33); а фиг. 66B является принципиальной схемой, показывающей STN-таблицу в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик".
Фиг. 67A-67C являются принципиальными схемами, показывающими плоскости VPA, VPB и VPC первичного видео, обрабатываемые посредством модуля 6501 сдвига видео в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно; фиг. 67D-67F являются принципиальными схемами, показывающими PG-плоскости PGD, PGE и PGF, обрабатываемые посредством второго модуля 4632 кадрирования в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно; а фиг. 67G-67I являются принципиальными схемами, показывающими данные PLG, PLH и PLI плоскости, комбинированные посредством второго сумматора 4642 в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно.
Фиг. 68A является принципиальной схемой, показывающей другой пример STN-таблицы в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик"; а фиг. 68B является принципиальной схемой, показывающей порядок регистрации множества фрагментов информации 6803 атрибутов потока, каждый из которых включает в себя режим 6812 сдвига видео, в STN-таблице, показанной на фиг. 68A.
Фиг. 69 является функциональной блок-схемой, показывающей другой пример структуры устройства воспроизведения, требуемой для сдвига видео.
Фиг. 70A является принципиальной схемой, показывающей структуру данных SPRM(37) в модуле 4236 хранения переменных проигрывателя; фиг. 70B является принципиальной схемой, показывающей видеоизображение IMG и субтитр SUB, отображаемые на экране SCR в случае, если цвет фона субтитра, представленного посредством PG-потока, задается как бесцветный прозрачный; а фиг. 70C является принципиальной схемой, показывающей видеоизображение IMG и субтитр SUB, отображаемые на экране SCR в случае, если значение цветовых координат цвета фона субтитра сохраняется в SPRM(37).
Фиг. 71A является принципиальной схемой, показывающей еще один другой пример STN-таблицы в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик"; а фиг. 71B является функциональной блок-схемой, показывающей еще один другой пример структуры устройства воспроизведения, требуемой для сдвига видео.
Фиг. 72A является принципиальной схемой, показывающей субтитры SB1 и SB2, которые соответствуют режиму без изменения; фиг. 72B является принципиальной схемой, показывающей субтитры SB1 и SB2, которые соответствуют режиму сдвига вниз; фиг. 72C является принципиальной схемой, показывающей субтитр SB1, отображаемый в режиме без изменения; а фиг. 72D является принципиальной схемой, показывающей субтитр SB3, отображаемый в режиме сдвига вверх, когда субтитр 7110 перемещения вверх видео не зарегистрирован в STN-таблице.
Фиг. 73A и 73B являются списками элементарных потоков, мультиплексированных в первом суб-TS и втором суб-TS на BD-ROM-диске, соответственно.
Фиг. 74 является принципиальной схемой, показывающей структуру данных STN-таблицы SS 3130 согласно варианту осуществления 2 настоящего изобретения.
Фиг. 75 является функциональной блок-схемой декодера 7525 системных целевых объектов согласно варианту осуществления 2 настоящего изобретения.
Фиг. 76 является частичной функциональной блок-схемой сумматора 7526 плоскостей в режиме 2 плоскостей.
Фиг. 77A, 77B и 77C являются принципиальными схемами, показывающими графическое изображение GOB0 для просмотра левым глазом, представленное посредством двумерного PG-потока, и графические изображения GOB1-GOB3 для просмотра правым глазом, представленные посредством PG-потока для просмотра правым глазом; а фиг. 77D, 77E и 77F являются принципиальными схемами, показывающими управление смещением, выполняемое для графического изображения для просмотра левым глазом, показанного на фиг. 77A, 77B и 77C.
Фиг. 78 является функциональной блок-схемой устройства 7800 записи согласно варианту осуществления 3 настоящего изобретения.
Фиг. 79A и 79B являются принципиальными схемами, соответственно, показывающими изображение в виде для просмотра левым глазом и виде для просмотра правым глазом, используемое для того, чтобы отображать одну сцену трехмерных видеоизображений; а фиг. 79C является принципиальной схемой, показывающей информацию глубины, вычисляемую из этих изображений посредством видеокодера 7802.
Фиг. 80 является блок-схемой последовательности операций способа для записи киносодержимого на BD-ROM-диске с использованием устройства 7800 записи, показанного на фиг. 78.
Фиг. 81 является схематичным представлением, показывающим способ, чтобы совмещать ATC-времена экстента между последовательными блоками данных.
Фиг. 82A-82C являются схематичными представлениями, иллюстрирующими принцип в отношении воспроизведения трехмерных видеоизображений (стереоскопических видеоизображений) в способе с использованием параллактических видеоизображений.
Фиг. 83 является схематичным представлением, показывающим пример составления вида LVW для просмотра левым глазом и вида RVW для просмотра правым глазом из комбинации двумерного видеоизображения MVW и карты DPH глубины.
Фиг. 84 является блок-схемой, показывающей обработку воспроизведения в устройстве воспроизведения в режиме двумерного воспроизведения.
Фиг. 85A является графиком, показывающим изменение объема DA данных, сохраненного в буфере 3721 считывания в ходе работы обработки воспроизведения, показанной на фиг. 84, в режиме двумерного воспроизведения; а фиг. 85B является принципиальной схемой, показывающей соответствие между блоком 8510 экстентов для воспроизведения и путем 8520 воспроизведения в режиме двумерного воспроизведения.
Фиг. 86 является примером таблицы соответствия между расстояниями SJUMP перехода и максимальными временами TJUMP_MAX перехода для BD-ROM-диска.
Фиг. 87 является блок-схемой, показывающей обработку воспроизведения в устройстве воспроизведения в режиме трехмерного воспроизведения.
Фиг. 88A и 88B являются графиками, показывающими изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, показанных на фиг. 87, когда трехмерные видеоизображения воспроизводятся плавно из одного блока экстентов, а фиг. 88C является схематичным представлением, показывающим соответствие между блоком 8810 экстентов и путем 8820 воспроизведения в режиме трехмерного воспроизведения.
Фиг. 89B является принципиальной схемой, показывающей (M+1)-й (буква M представляет целое число, превышающее или равное 1) блок 8901 экстентов и (M+2)-й блок 8902 экстентов и соответствие между этими блоками 8901 и 8902 экстентов и путем 8920 воспроизведения в режиме трехмерного воспроизведения; а фиг. 89A является группой графиков, показывающей изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, а также изменения суммы DA1+DA2, когда трехмерные видеоизображения непрерывно воспроизводятся плавно из двух блоков 8901 и 8902 экстентов.
Фиг. 90A и 90B являются графиками, показывающими изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, когда трехмерные видеоизображения воспроизводятся плавно из двух последовательных блоков 8901 и 8902 экстентов, показанных на фиг. 89B.
Фиг. 91 является блок-схемой, показывающей систему обработки видеопотоков, предоставленную в декодере 4225 системных целевых объектов в режиме трехмерного воспроизведения.
Фиг. 92A и 92B являются графиками, показывающими временные изменения скорости REXT1 передачи для воспроизведения базового вида и скорости передачи для воспроизведения зависимого вида REXT2 в этом случае, соответственно; а фиг. 92C является графиком, показывающим временное изменение суммы скорости REXT1 передачи для воспроизведения базового вида и скорости передачи для воспроизведения зависимого вида REXT2, показанных на фиг. 92A и 92B.
Фиг. 93 является принципиальной схемой, показывающей взаимосвязи между TS-пакетами, которые передаются в декодер системных целевых объектов из модуля депакетирования источников до PID-фильтра, и ATC-временами.
Фиг. 94A является таблицей, показывающей максимальные размеры maxSEXT1[n] и maxSEXT2[n] экстентов для пары экстентов в различных комбинациях скорости REXT1[n] передачи для воспроизведения базового вида и скорости REXT2[n] передачи для воспроизведения зависимого вида; фиг. 94B является принципиальной схемой, показывающей, что пара EXT1[n], EXT2[n] экстентов располагается в начале блока 9401 экстентов, размещаемого после межслойной границы LB, а блок B[n] данных для воспроизведения базового вида пары экстентов размещается перед блоком D[n] данных для воспроизведения зависимого вида.
Фиг. 95A и 95B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 и RB2, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9401 и 9402 экстентов, показанных на фиг. 94B.
Фиг. 96A является принципиальной схемой, показывающей синтаксис начальной точки экстента в случае, если порядок блоков данных изменяется на противоположный в паре экстентов, расположенной в середине блока экстентов; фиг. 96B является принципиальной схемой, показывающей взаимосвязи между экстентом EXT1[k] для воспроизведения базового вида (k=0, 1, 2, ...), принадлежащим файлу base, и флагом начала экстента, указываемым посредством начальной точки экстента; фиг. 96C является принципиальной схемой, показывающей взаимосвязи между экстентом EXT2[k] для воспроизведения зависимого вида, принадлежащим файлу DEP, и флагом начала экстента; а фиг. 96D является принципиальной схемой, показывающей взаимосвязи между экстентом SS EXTSS[0], принадлежащим файлу SS, и блоками экстентов на BD-ROM-диске.
Фиг. 97C является принципиальной схемой, показывающей компоновку блока данных, который требует самой большой емкости RB1 4221; фиг. 97A и 97B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9701 и 9702 экстентов, показанных на фиг. 97C; фиг. 97F является принципиальной схемой, показывающей компоновку блока данных, который требует самой большой емкости RB2 4222; а фиг. 97D и 97E являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9703 и 9704 экстентов, показанных на фиг. 97F.
Фиг. 98C является принципиальной схемой, показывающей блок 9810 экстентов, который включает в себя в середине пару экстентов, в которой порядок блоков данных изменяется на противоположный; а фиг. 98A и 98B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из блока 9801 экстентов, показанного на фиг. 98C.
Фиг. 99 является принципиальной схемой, показывающей взаимосвязь между блоком 9900 экстентов и файлами 9910-9920 AV-потока, причем блок 9900 экстентов включает в себя пару экстентов в середине, а пара экстентов имеет блоки данных в обратном порядке.
Фиг. 100 является принципиальной схемой, показывающей компоновку 1 группы блоков данных, записанной до и после межслойной границы LB на BD-ROM-диске.
Фиг. 101 является схематичным представлением, показывающим путь A110 воспроизведения в режиме двумерного воспроизведения и путь A120 воспроизведения в режиме трехмерного воспроизведения для группы блоков данных в компоновке 1, показанной на фиг. 100.
Фиг. 102 является принципиальной схемой, показывающей компоновку 2 группы блоков данных, записанной до и после межслойной границы LB на BD-ROM-диске.
Фиг. 103 является схематичным представлением, показывающим путь A310 воспроизведения в режиме двумерного воспроизведения и путь A320 воспроизведения в режиме трехмерного воспроизведения для группы блоков данных в компоновке 2, показанной на фиг. 102.
Фиг. 104 является принципиальной схемой, показывающей взаимосвязи между временем SEXT1[3]/RUD72 считывания блока исключительно для трехмерного воспроизведения B[3]SS, расположенного в конце второго блока A202 экстентов, и нижним пределом емкости RB2 4222.
Фиг. 105 является схематичным представлением, показывающим точки A510 и A520 входа, заданные для экстентов EXT1[k], и EXT2[k] (буква k представляет целое число, превышающее или равное 0) в файле base A501 и файле DEP A502.
Фиг. 106A является принципиальной схемой, показывающей путь воспроизведения, когда ATC-времена экстента и времена воспроизведения видеопотока отличаются между смежными блоками данных для воспроизведения базового вида и блоками данных для воспроизведения зависимого вида; а фиг. 106B является принципиальной схемой, показывающей путь воспроизведения, когда времена воспроизведения видеопотока равны для смежных блоков данных для воспроизведения базового вида и зависимого вида.
Фиг. 107A является схематичным представлением, показывающим путь воспроизведения для мультиплексированных потоковых данных с поддержкой многоракурсного режима, фиг. 107B является схематичным представлением, показывающим группу A701 блоков данных, записанную на BD-ROM-диске, и соответствующий путь A702 воспроизведения в L/R-режиме, а фиг. 107C является схематичным представлением, показывающим блок экстентов, сформированный посредством потоковых данных Ak, Bk и Ck для различных ракурсов.
Фиг. 108 является схематичным представлением, показывающим (i) группу A801 блоков данных, составляющих период многоракурсного режима, и (ii) путь A810 воспроизведения в режиме двумерного воспроизведения и путь A820 воспроизведения в L/R-режиме, которые соответствуют группе A801 блоков данных.
Фиг. 109 является схематичным представлением, иллюстрирующим технологию для обеспечения совместимости оптического диска, сохраняющего трехмерное видеосодержимое, с устройствами двумерного воспроизведения.
Фиг. 110 является функциональной блок-схемой устройства воспроизведения, реализованного посредством использования интегральной схемы 3 согласно варианту осуществления 4 настоящего изобретения.
Фиг. 111 является функциональной блок-схемой, показывающей характерную структуру процессора 5 потоков, показанного на фиг. 110.
Фиг. 112 является функциональной блок-схемой модуля 53 переключения и окружающих модулей, показанных на фиг. 110, когда модулем 53 переключения является DMAC.
Фиг. 113 является функциональной блок-схемой, показывающей характерную структуру модуля 8 AV-вывода, показанного на фиг. 110.
Фиг. 114 является принципиальной схемой, показывающей один пример способа использования запоминающего устройства 2 во время процесса наложения изображений.
Фиг. 115 является принципиальной схемой, показывающей способ наложения графической плоскости на плоскость для просмотра левым глазом посредством использования запоминающего устройства 2, показанного на фиг. 114.
Фиг. 116 является принципиальной схемой, показывающей способ наложения графической плоскости на плоскость для просмотра правым глазом посредством использования запоминающего устройства 2, показанного на фиг. 114.
Фиг. 117 является принципиальной схемой, показывающей другой пример способа использования запоминающего устройства 2 во время процесса наложения изображений.
Фиг. 118 является подробной функциональной блок-схемой модуля 8 AV-вывода и модуля вывода данных в устройстве воспроизведения, показанном на фиг. 113.
Фиг. 119A и 119B являются схематичными представлениями, показывающими примеры топологии шины управления и шины данных, размещаемых в интегральной схеме 3, показанной на фиг. 110.
Фиг. 120 является функциональной блок-схемой, показывающей структуру интегральной схемы согласно варианту осуществления 4 и окружающие модули, которые включаются в дисплейное устройство.
Фиг. 121 является подробной функциональной блок-схемой модуля 8 AV-вывода, показанного на фиг. 120.
Фиг. 122 является блок-схемой последовательности операций способа обработки воспроизведения посредством устройства воспроизведения с использованием интегральной схемы 3, показанной на фиг. 110.
Фиг. 123 является блок-схемой последовательности операций способа, показывающей подробности этапов S1-S6, показанных на фиг. 122.
Описание вариантов осуществления
Далее описывается носитель записи и устройство воспроизведения, относящиеся к предпочтительным вариантам осуществления настоящего изобретения, со ссылкой на чертежи.
Первый вариант осуществления
Фиг. 1 является схематичным представлением, показывающим систему домашнего кинотеатра, которая использует носитель записи согласно варианту осуществления 1 настоящего изобретения. Эта система домашнего кинотеатра приспосабливает способ воспроизведения трехмерных видеоизображений (стереоскопических видеоизображений), который использует параллактические видеоизображения, и, в частности, приспосабливает способ поочередной последовательности кадров в качестве способа отображения (подробности см. в разделе "<Дополнительное пояснение>"). Как показано на фиг. 1, эта система домашнего кинотеатра воспроизводит носитель 101 записи и включает в себя устройство 102 воспроизведения, дисплейное устройство 103, очки 104 с затвором и пульт 105 дистанционного управления. Устройство 102 воспроизведения и дисплейное устройство 103 предоставляются независимо друг от друга, как показано на фиг. 1. Альтернативно, устройство 102 воспроизведения и дисплейное устройство 103 могут предоставляться как один модуль.
Носителем 101 записи является неперезаписываемый диск Blu-Ray (BD)™, т.е. BD-ROM-диск. Носителем 101 записи может быть другой портативный носитель записи, такой как оптический диск с другим форматом, к примеру, DVD и т.п., съемный жесткий диск (HDD) или полупроводниковое запоминающее устройство, такое как карта памяти в формате SD. Этот носитель записи, т.е. BD-ROM-диск 101, сохраняет киносодержимое как трехмерные видеоизображения. Это содержимое включает в себя видеопотоки, представляющие вид для просмотра левым глазом и вид для просмотра правым глазом для трехмерных видеоизображений. Содержимое дополнительно может включать в себя видеопоток, представляющий карту глубины для трехмерных видеоизображений. Эти видеопотоки компонуются на BD-ROM-диске 101 в единицах блоков данных, и доступ к ним осуществляется с использованием структуры файлов, описанной ниже. Видеопотоки, представляющие вид для просмотра левым глазом или вид для просмотра правым глазом, используются посредством как устройства двумерного воспроизведения, так и устройства трехмерного воспроизведения, чтобы воспроизводить содержимое как двумерные видеоизображения. В отличие от этого, пара видеопотоков, представляющих вид для просмотра левым глазом и вид для просмотра правым глазом, либо пара видеопотоков, представляющих или вид для просмотра левым глазом, или вид для просмотра правым глазом и карту глубины, используется посредством устройства трехмерного воспроизведения, чтобы воспроизводить содержимое как трехмерные видеоизображения.
BD-ROM-накопитель 121 устанавливается на устройстве 102 воспроизведения. BD-ROM-накопитель 121 является накопителем на оптических дисках, соответствующим формату BD-ROM. Устройство 102 воспроизведения использует BD-ROM-накопитель 121, чтобы считывать содержимое из BD-ROM-диска 101. Устройство 102 воспроизведения дополнительно декодирует содержимое в видеоданные/аудиоданные. Устройство 102 воспроизведения является устройством трехмерного воспроизведения и может воспроизводить содержимое как двумерные видеоизображения и как трехмерные видеоизображения. В дальнейшем в этом документе, рабочие режимы устройства 102 воспроизведения при воспроизведении двумерных видеоизображений и трехмерных видеоизображений, соответственно, называются "режимом двумерного воспроизведения" и "режимом трехмерного воспроизведения". В режиме двумерного воспроизведения видеоданные включают в себя только видеокадр либо для просмотра левым глазом, либо для просмотра правым глазом. В режиме трехмерного воспроизведения видеоданные включают в себя видеокадры для просмотра левым глазом и правым глазом.
Режим трехмерного воспроизведения дополнительно разделяется на левый/правый (L/R) режим и режим глубины. В "L/R-режиме" пара видеокадров для просмотра левым глазом и правым глазом формируется из комбинации видеопотоков, представляющих вид для просмотра левым глазом и вид для просмотра правым глазом. В "режиме глубины" пара видеокадров для просмотра левым глазом и правым глазом формируется из комбинации видеопотоков, представляющих либо вид для просмотра левым глазом, либо вид для просмотра правым глазом, и карты глубины. Устройство 102 воспроизведения содержит L/R-режим. Устройство 102 воспроизведения дополнительно может содержать режим глубины.
Устройство 102 воспроизведения подключается к дисплейному устройству 103 через кабель 122 на основе мультимедийного интерфейса высокой четкости (HDMI). Устройство 102 воспроизведения преобразует видеоданные/аудиоданные в видеосигнал/аудиосигнал в HDMI-формате и передает сигналы на дисплейное устройство 103 через HDMI-кабель 122. В режиме двумерного воспроизведения, только один из видеокадра для просмотра левым глазом или для просмотра правым глазом мультиплексируется в видеосигнале. В режиме трехмерного воспроизведения видеокадры для просмотра левым глазом и для просмотра правым глазом мультиплексируются во времени в видеосигнале. Дополнительно, устройство 102 воспроизведения обменивается CEC-сообщениями с дисплейным устройством 103 через HDMI-кабель 122. Таким образом, устройство 102 воспроизведения может опрашивать дисплейное устройство 103 на предмет того, поддерживает оно или нет воспроизведение трехмерных видеоизображений.
Дисплейное устройство 103 является жидкокристаллическим дисплеем. Альтернативно, дисплейное устройство 103 может быть другим типом плоскопанельного дисплея, таким как плазменный дисплей, органический EL-дисплей и т.д. или проектор. Дисплейное устройство 103 отображает видео на экране 131 в ответ на видеосигнал и инструктирует динамикам формировать аудио ответ на аудиосигнал. Дисплейное устройство 103 поддерживает воспроизведение трехмерных видеоизображений. Во время воспроизведения двумерных видеоизображений либо вид для просмотра левым глазом, либо вид для просмотра правым глазом отображаются на экране 131. Во время воспроизведения трехмерных видеоизображений вид для просмотра левым глазом и вид для просмотра правым глазом поочередно отображаются на экране 131.
Дисплейное устройство 103 включает в себя передающий модуль 132 левых/правых сигналов. Передающий модуль 132 левых/правых сигналов передает левый/правый сигнал LR в очки 104 с затвором через инфракрасные лучи или посредством радиопередачи. Левый/правый сигнал LR указывает то, является изображение, в настоящий момент отображаемое на экране 131, изображением для просмотра левым глазом или правым глазом. Во время воспроизведения трехмерных видеоизображений дисплейное устройство 103 обнаруживает переключение кадров посредством различения кадра для просмотра левым глазом и кадра для просмотра правым глазом на основе управляющего сигнала, который сопровождает видеосигнал. Кроме того, дисплейное устройство 103 инструктирует передающему модулю 132 левых/правых сигналов переключать левый/правый сигнал LR синхронно с обнаруженным переключением кадров.
Очки 104 с затвором включают в себя две жидкокристаллических дисплейных панели 141L и 141R и приемный модуль 142 левых/правых сигналов. Жидкокристаллические дисплейные панели 141L и 141R, соответственно, составляют каждую из левых и правых частей линзы. Приемный модуль 142 левых/правых сигналов принимает левый/правый сигнал LR и в соответствии с изменениями в нем передает сигнал в левую и правую жидкокристаллические дисплейные панели 141L и 141R. В ответ на сигнал, каждая из жидкокристаллических дисплейных панелей 141L и 141R либо позволяет свету проходить через всю панель, либо не пропускает свет. Например, когда левый/правый сигнал LR указывает отображение для просмотра левым глазом, жидкокристаллическая дисплейная панель 141L для левого глаза позволяет свету проходить, при этом жидкокристаллическая дисплейная панель 141R для правого глаза не пропускает свет. Когда левый/правый сигнал LR указывает отображение для просмотра правым глазом, дисплейная панель выполняет противоположные действия. Две жидкокристаллических дисплейных панели 141L и 141R тем самым поочередно позволяют свету проходить синхронно с переключением кадров. Как результат, когда зритель смотрит на экран 131 с надетыми очками 104 с затвором, вид для просмотра левым глазом показывается только для левого глаза зрителя, а вид для просмотра правым глазом показывается только для правого глаза. Зритель принудительно воспринимает разность между изображениями, видимыми посредством каждого глаза, как бинокулярный параллакс для одного стереоскопического изображения, и тем самым видеоизображение кажется стереоскопическим.
Пульт 105 дистанционного управления включает в себя функциональный модуль и передающий модуль. Функциональный модуль включает в себя множество кнопок. Кнопки соответствуют каждой из функций устройства 102 воспроизведения и дисплейного устройства 103, к примеру, включение и включение питания, начало или остановка воспроизведения BD-ROM-диска 101 и т.д. Функциональный модуль обнаруживает, когда пользователь нажимает кнопку, и передает идентификационную информацию для кнопки в передающий модуль как сигнал. Передающий модуль преобразует этот сигнал в сигнал IR и выводит его через инфракрасные лучи или радиопередачу в устройство 102 воспроизведения или на дисплейное устройство 103. С другой стороны, устройство 102 воспроизведения и дисплейное устройство 103 принимают этот сигнал IR, определяют кнопку, указанную посредством этого сигнала IR, и выполняют функцию, ассоциированную с кнопкой. Таким образом, пользователь может удаленно управлять устройством 102 воспроизведения или дисплейным устройством 103.
<Структура данных BD-ROM-диска>
Фиг. 2 является схематичным представлением, показывающим структуру данных BD-ROM-диска 101. Как показано на фиг. 2, служебная область 201 заготовки (BCA) предоставляется в крайней внутренней части области записи данных на BD-ROM-диске 101. Только BD-ROM-накопителю 121 разрешено осуществлять доступ к BCA, а доступ посредством прикладных программ запрещается. BCA 201 тем самым может использоваться в качестве технологии для защиты авторского права. В области записи данных за пределами BCA 201, дорожки идут по спирали от внутренней к внешней окружности. На фиг. 2, дорожка 202 схематически идет в поперечном направлении. Левая сторона представляет внутреннюю периферическую часть диска 101, а правая сторона представляет внешнюю периферическую часть. Как показано на фиг. 2, дорожка 202 содержит начальную область 202A, область 202B тома и конечную область 202C по порядку от внутренней окружности. Начальная область 202A предоставляется непосредственно на внешней границе BCA 201. Начальная область 202A включает в себя информацию, необходимую для BD-ROM-накопителя 121, чтобы осуществлять доступ к области 202B тома, такую как размер, физический адрес и т.д. данных, записанных в область 202B тома. Конечная область 202C предоставляется на крайней внешней периферической части области записи данных и указывает конец области 202B тома. Область 202B тома включает в себя данные приложения, такие как видеоизображения, аудио и т.д.
Область 202B тома разделяется на небольшие области 202D, называемые "секторами". Секторы имеют общий размер, например, 2048 байтов. Каждому сектору 202D последовательно назначается порядковый номер по порядку с начала области 202B тома. Эти порядковые номера называются номерами логических блоков (LBN) и используются в логических адресах на BD-ROM-диске 101. В ходе считывания данных из BD-ROM-диска 101, данные, предназначенные для того, чтобы считываться, указываются через обозначение LBN для целевого сектора. К области 202B тома тем самым может осуществляться доступ в единицах секторов. Кроме того, на BD-ROM-диске 101 логические адреса являются практически идентичными физическим адресам. В частности, в области, в которой LBN являются последовательными, физические адреса также являются практически последовательными. Соответственно, BD-ROM-накопитель 121 может последовательно считывать данные из секторов, имеющих последовательные LBN, без инструктирования оптической головке воспроизведения выполнять поиск дорожек.
Данные, записанные в область 202B тома, управляются согласно предварительно определенной файловой системе. Универсальный формат диска (UDF) приспосабливается в качестве этой файловой системы. Альтернативно, файловой системой может быть ISO9660. Данные, записанные в области 202B тома, представляются в формате каталогов/файлов в соответствии с файловой системой (подробности см. в разделе <<Дополнительное пояснение>>). Другими словами, данные доступны в единицах каталогов или файлов.
<<Структура каталогов/файлов на BD-ROM-диске>>
Фиг. 2 дополнительно показывает структуру каталогов/файлов данных, хранимых в области 202B тома на BD-ROM-диске 101. Как показано на фиг. 2, в этой структуре каталогов/файлов, каталог 210 (BDMV) BD-фильмов находится непосредственно в рамках каталога 203 ROOT. В рамках каталога 210 BDMV располагаются индексный файл (index.bdmv) 211 и файл 212 кинообъектов (MovieObject.bdmv).
Индексный файл 211 содержит информацию для управления как единым целым содержимым, записанным на BD-ROM-диске 101. В частности, эта информация включает в себя как информацию, чтобы инструктировать устройству 102 воспроизведения распознавать содержимое, так и индексную таблицу. Индексная таблица является таблицей соответствия между тайтлом, составляющим содержимое, и программой, чтобы управлять работой устройства 102 воспроизведения. Эта программа называется "объектом". Типами объекта являются кинообъект и BD-J-объект (BD Java™).
Файл 212 кинообъектов, в общем, сохраняет множество кинообъектов. Каждый кинообъект включает в себя последовательность навигационных команд. Навигационная команда - это команда управления, инструктирующая устройству 102 воспроизведения выполнять процессы воспроизведения аналогично общим DVD-проигрывателям. Типами навигационных команд являются, например, команда считывания, чтобы считывать файл списков воспроизведения, соответствующий тайтлу, команда воспроизведения, чтобы воспроизводить потоковые данные из файла AV-потока, указанного посредством файла списков воспроизведения, и команда перехода, чтобы выполнять переход к другому тайтлу. Навигационные команды записываются на интерпретируемом языке и расшифровываются посредством интерпретатора, т.е. программы управления заданиями, включенной в устройство 102 воспроизведения, тем самым инструктируя модулю управления выполнять требуемое задание. Навигационная команда состоит из кода операции и операнда. Код операции описывает тип операции, которую устройство 102 воспроизведения должно выполнять, такую как деление, воспроизведение или вычисление тайтла и т.д. Операнд указывает идентификационную информацию, предназначенную посредством операции, такую как номер тайтла и т.д. Модуль управления устройства 102 воспроизведения вызывает кинообъект в ответ, например, на пользовательскую операцию и выполняет навигационные команды, включенные в вызываемый кинообъект, в порядке последовательности. Способом, аналогичным общим DVD-проигрывателям, устройство 102 воспроизведения сначала отображает меню на дисплейном устройстве 103, чтобы давать возможность пользователю выбирать команду. Устройство 102 воспроизведения затем выполняет начало/остановку воспроизведения тайтла или переключение на другой тайтл в ответ на выбранную команду, тем самым динамически изменяя ход выполнения воспроизведения видео.
Как показано на фиг. 2, каталог 210 BDMV дополнительно содержит каталог 220 списков воспроизведения (PLAYLIST), каталог 230 информации о клипах (CLIPINF); каталог 240 потока (STREAM), каталог 250 BD-J-объектов (BDJO: объект BD Java) и каталог 260 Java-архива (JAR: Java-архив).
Три типа файлов AV-потока, (01000.m2ts) 241, (02000.m2ts) 242 и (03000.m2ts) 243, а также каталог 244 стереоскопических перемежающихся файлов (SSIF) находятся непосредственно в рамках каталога 240 STREAM. Два типа файлов AV-потока, (01000.ssif) 244A и (02000.ssif) 244B, находятся непосредственно в рамках каталога 244 SSIF.
"Файл AV-потока" означает файл, из фактического видеосодержимого, записанного на BD-ROM-диске 101, который соответствует формату файла, определенному посредством файловой системы. Такое фактическое видеосодержимое, в общем, означает потоковые данные, в которых мультиплексированы различные типы потоковых данных, представляющие видео, аудио, субтитры и т.д. Мультиплексированные потоковые данные могут широко разделяться на два типа: основной транспортный поток (TS) и суб-TS.
"Основной TS" - это мультиплексированные потоковые данные, которые включают в себя видеопоток для воспроизведения базового вида в качестве потока первичного видео. "Видеопоток для воспроизведения базового вида" - это видеопоток, который может воспроизводиться независимо и который представляет двумерные видеоизображения. Эти двумерные видеоизображения упоминаются как "базовый вид" или "основной вид".
"Суб-TS" - это мультиплексированные потоковые данные, которые включают в себя видеопоток для воспроизведения зависимого вида в качестве потока первичного видео. "Видеопоток для воспроизведения зависимого вида" - это видеопоток, который требует видеопотока для воспроизведения базового вида для воспроизведения и представляет трехмерные видеоизображения посредством комбинирования с видеопотоком для воспроизведения базового вида. Типами видеопотоков для воспроизведения зависимого вида являются видеопоток для просмотра правым глазом, видеопоток для просмотра левым глазом и поток карт глубины. Когда базовый вид - это вид для просмотра левым глазом трехмерных видеоизображений, "видеопоток для просмотра правым глазом" - это видеопоток, представляющий вид для просмотра правым глазом трехмерных видеоизображений. Обратное применимо к "видеопотоку для просмотра левым глазом". Когда базовый вид - это проекция трехмерных видеоизображений на виртуальном двумерном экране, "поток карт глубины" - это потоковые данные, представляющие карту глубины для трехмерных видеоизображений. Двумерные видеоизображения или карта глубины, представленная посредством видеопотока для воспроизведения зависимого вида, упоминается как "зависимый вид" или "подвид".
В зависимости от типа сохраненных мультиплексированных потоковых данных файлы AV-потока разделяются на три типа: файл 2D, файл dependent (в дальнейшем в этом документе, сокращенно как "файл DEP"), и перемежающийся файл (в дальнейшем в этом документе, сокращенно как "файл SS"). "Файл 2D" является файлом AV-потока для воспроизведения двумерных видеоизображений в режиме двумерного воспроизведения и включает в себя основной TS. "Файл DEP" является файлом AV-потока, который включает в себя суб-TS. "Файл SS" является файлом AV-потока, который включает в себя основной TS и суб-TS, представляющие идентичные трехмерные видеоизображения. В частности, файл SS совместно использует свой основной TS с определенным файлом 2D и совместно использует свой суб-TS с определенным файлом DEP. Другими словами, в файловой системе на BD-ROM-диске 101, к основному TS доступ может осуществляться посредством как файла SS, так и файла 2D, а к суб-TS доступ может осуществляться посредством как файла SS, так и файла DEP. Эта настройка, посредством которой последовательность данных, записанных на BD-ROM-диске 101, является общей для различных файлов, и доступ к которой может осуществляться посредством всех файлов, называется "перекрестной связью файлов".
В примере, показанном на фиг. 2, первый файл 241 AV-потока (01000.m2ts) является файлом 2D, второй файл 242 AV-потока (02000.m2ts) и третий файл 243 AV-потока (03000.m2ts) оба являются файлом DEP. Таким образом, файлы 2D и файлы DEP находятся непосредственно в рамках каталога 240 STREAM. Первый файл AV-потока, т.е. видеопоток для воспроизведения базового вида, который включает в себя файл 2D 241, представляет вид для просмотра левым глазом трехмерных видеоизображений. Второй файл AV-потока, т.е. видеопоток для воспроизведения зависимого вида, который включает в себя первый файл DEP 242, включает в себя видеопоток для просмотра правым глазом. Третий файл AV-потока, т.е. видеопоток для воспроизведения зависимого вида, который включает в себя второй файл DEP 243, включает в себя поток карт глубины.
В примере, показанном на фиг. 2, четвертый файл 244A AV-потока (01000.ssif) и пятый файл 244B AV-потока (02000.ssif) являются файлом SS. Таким образом, файлы SS находятся непосредственно в рамках каталога 244 SSIF. Четвертый файл AV-потока, т.е. файл SS 244A, совместно использует основной TS и, в частности, видеопоток для воспроизведения базового вида, с файлом 2D 241 и совместно использует суб-TS, в частности, видеопоток для просмотра правым глазом с первым файлом DEP 242. Пятый файл AV-потока, т.е. второй файл SS 244B, совместно использует основной TS и, в частности, видеопоток для воспроизведения базового вида с первым файлом 2D 241 и совместно использует суб-TS, в частности, поток карт глубины с третьим файлом DEP 243.
Три типа файлов информации о клипах, (01000.clpi) 231, (02000.clpi) 232 и (03000.clpi) 233, находятся в каталоге 230 CLIPINF. "Файл информации о клипах" является файлом, ассоциированным на основе "один-к-одному" с файлом 2D и файлом DEP, и, в частности, содержит карту вхождений для каждого файла. "Карта вхождений" - это таблица соответствия между временем представления для каждой сцены, представленного посредством файла, и адресом в рамках каждого файла, в который записана сцена. Из файлов информации о клипах, файл информации о клипах, ассоциированный с файлом 2D, называется "файлом информации о двумерных клипах", а файл информации о клипах, ассоциированный с файлом DEP, называется "файлом информации о клипах для воспроизведения зависимого вида". В примере, показанном на фиг. 2, первый файл 231 информации о клипах (01000.clpi) является файлом информации о двумерных клипах и ассоциирован с файлом 2D 241. Второй файл 232 информации о клипах (02000.clpi) и третий файл 233 информации о клипах (03000.clpi) оба являются файлом информации о клипах зависимого вида и ассоциированы с первым файлом 242 DEP и вторым файлом 243 DEP, соответственно.
Три типа файлов списков воспроизведения, (00001.mpls) 221, (00002.mpls) 222 и (00003.mpls) 223, находятся в каталоге 220 PLAYLIST. "Файл списков воспроизведения" является файлом, указывает который путь воспроизведения файла AV-потока, т.е. часть файла AV-потока для воспроизведения и порядок воспроизведения. Типами файлов списков воспроизведения являются файл списков для двумерного воспроизведения и файл списков для трехмерного воспроизведения. "Файл списков для двумерного воспроизведения" указывает путь воспроизведения файла 2D. "Файл списков для трехмерного воспроизведения" указывает, для устройства воспроизведения в режиме двумерного воспроизведения - путь воспроизведения файла 2D, а для устройства воспроизведения в режиме трехмерного воспроизведения - путь воспроизведения файла SS. Как показано в примере на фиг. 2, первый файл 221 списков воспроизведения (00001.mpls) является файлом списков для двумерного воспроизведения и указывает путь воспроизведения файла 2D 241. Второй файл 222 списков воспроизведения (00002.mpls) является файлом списков для трехмерного воспроизведения, который указывает, для устройства воспроизведения в режиме двумерного воспроизведения - путь воспроизведения файла 2D 241, а для устройства трехмерного воспроизведения в L/R-режиме - путь воспроизведения файла SS 244A. Третий файл 223 списков воспроизведения (00003.mpls) является файлом списков для трехмерного воспроизведения, который указывает, для устройства воспроизведения в режиме двумерного воспроизведения - путь воспроизведения файла 2D 241, а для устройства трехмерного воспроизведения в режиме глубины - путь воспроизведения второго файла SS 244B.
Файл 251 BD-J-объектов (XXXXX.bdjo) находится в каталоге 250 BDJO. Файл 251 BD-J-объектов включает в себя один BD-J-объект. BD-J-объект - это программа в байтовом коде, чтобы инструктировать виртуальной машине Java, установленной на устройстве 102 воспроизведения, воспроизводить тайтл и подготавливать посредством рендеринга графические изображения. BD-J-объект пишется на языке компилятора, таком как Java и т.п. BD-J-объект включает в себя таблицу управления приложениями и идентификационную информацию для файла списков воспроизведения, к которому следует обращаться. "Таблица управления приложениями" - это список Java-приложений, которые должны выполняться посредством виртуальной машины Java, и их периода выполнения, т.е. жизненного цикла. "Идентификационная информация файла списков воспроизведения, к которому обращаются", идентифицирует файл списков воспроизведения, который соответствует тайтлу, который должен воспроизводиться. Виртуальная машина Java вызывает BD-J-объект в ответ на пользовательскую операцию или прикладную программу и выполняет Java-приложение согласно таблице управления приложениями, включенной в BD-J-объект. Следовательно, устройство 102 воспроизведения динамически изменяет ход выполнения видео для каждого воспроизводимого тайтла или инструктирует дисплейному устройству 103 отображать графические изображения независимо от видео тайтлов.
Файл 261 JAR (YYYYY.jar) находится в каталоге 260 JAR. Каталог 261 JAR, в общем, включает в себя множество фактических Java-приложений, которые должны выполняться в соответствии с таблицей управления приложениями, показанной в BD-J-объекте. Java-приложение - это программа в байтовом коде, написанная на таком языке компилятора, как Java и т.п., аналогично BD-J-объекту. Типы Java-приложений включают в себя программы, инструктирующие виртуальной машине Java выполнять воспроизведение процесса тайтла, и программы, инструктирующие виртуальной машине Java подготавливать посредством рендеринга графические изображения. Файл 261 JAR является архивным файлом Java, и когда он считывается посредством устройства 102 воспроизведения, он загружается во внутреннем запоминающем устройстве. Таким образом, Java-приложение сохраняется в запоминающем устройстве.
<<Структура мультиплексированных потоковых данных>>
Фиг. 3A является списком элементарных потоков, мультиплексированных в основном TS на BD-ROM-диске 101. Основной TS является цифровым потоком в формате транспортного потока (TS) MPEG-2 и включен в файл 2D 241, показанный на фиг. 2. Как показано на фиг. 3A, основной TS включает в себя поток 301 первичного видео, потоки 302A и 302B первичного аудио и потоки 303A и 303B презентационной графики (PG). Основной TS дополнительно может включать в себя поток 304 интерактивной графики (IG), поток 305 вторичного аудио и поток 306 вторичного видео.
Поток 301 первичного видео представляет первичное видео фильма, а поток 306 вторичного видео представляет вторичное видео фильма. Первичное видео является основным видео, относящимся к содержимому, таким как основной признак фильма, и отображается, например, во весь экран. С другой стороны, вторичное видео отображается на экране одновременно с первичным видео с использованием, например, способа "картинка-в-картинке", так что изображения вторичного видео отображаются в меньшем окне в рамках изображений первичного видео. Поток 301 первичного видео и поток 306 вторичного видео являются видеопотоками для воспроизведения базового вида. Каждый из видеопотоков 301 и 306 кодируется посредством способа кодирования со сжатием видео, такого как MPEG-2, MPEG-4 AVC или SMPTE VC-1.
Потоки 302A и 302B первичного аудио представляют первичное аудио фильма. В этом случае, два потока 302A и 302B первичного аудио заданы на различных языках. Поток 305 вторичного аудио представляет вторичное аудио, которое должно смешиваться с первичным аудио, таким как звуковые эффекты, сопровождающие работу интерактивного экрана. Каждый из аудиопотоков 302A, 302B и 305 кодируется посредством такого способа, как AC-3, Dolby Digital Plus ("Dolby Digital" является зарегистрированной торговой маркой), Meridian Lossless Packing™ (MLP), Digital Theater System™ (DTS), DTS-HD или линейная импульсно-кодовая модуляция (PCM).
Каждый из PG-потоков 303A и 303B представляет графические изображения, такие как субтитры, сформированные посредством графики, которые должны отображаться наложенными на видеоизображения, представленные посредством потока 301 первичного видео. Два PG-потока 303A и 303B представляют, например, субтитры на различном языке. IG-поток 304 представляет графические элементы графического пользовательского интерфейса (GUI) и их компоновку для составления интерактивного экрана на экране 131 в дисплейном устройстве 103.
Элементарные потоки 301-306 идентифицируются посредством идентификаторов пакетов (PID). PID назначаются, например, следующим образом. Поскольку один основной TS включает в себя только один поток первичного видео, потоку 301 первичного видео назначается шестнадцатеричное значение 0x1011. Когда до 32 других элементарных потоков могут быть мультиплексированы по типу в одном основном TS, потокам 302A и 302B первичного аудио назначается любое значение от 0x1100 до 0x111F. PG-потокам 303A и 303B назначается любое значение от 0x1200 до 0x121F. IG-потоку 304 назначается любое значение от 0x1400 до 0x141F. Потоку 305 вторичного аудио назначается любое значение от 0x1A00 до 0x1A1F. Потоку 306 вторичного видео назначается любое значение от 0x1B00 до 0x1B1F.
Фиг. 3B является списком элементарных потоков, мультиплексированных в суб-TS на BD-ROM-диске 101. Суб-TS является мультиплексированными потоковыми данными в формате MPEG-2 TS и включается в файл DEP 242, показанный на фиг. 2. Как показано на фиг. 3B, суб-TS включает в себя два потока 311R и 311D первичного видео. 311R - это видеопоток для просмотра правым глазом, тогда как 311D - это поток карт глубины. Следует отметить, что потоки 311R и 311D первичного видео могут быть мультиплексированы в файлы 242 и 243 DEP, которые являются различными файлами, раздельно. Когда поток 301 первичного видео в основном TS представляет вид для просмотра левым глазом трехмерных видеоизображений, видеопоток 311R для просмотра правым глазом представляет вид для просмотра правым глазом трехмерных видеоизображений. Поток 311D карт глубины представляет трехмерные видеоизображения в комбинации с потоком 301 первичного видео в основном TS. Дополнительно, суб-TS может включать в себя потоки 312R и 312D вторичного видео. 312R - это видеопоток для просмотра правым глазом, тогда как 312D - это поток карт глубины. Когда поток 306 вторичного видео в основном TS представляет вид для просмотра левым глазом трехмерных видеоизображений, видеопоток 312R для просмотра правым глазом представляет вид для просмотра правым глазом трехмерных видеоизображений. Поток 312D карт глубины представляет трехмерные видеоизображения в комбинации с потоком 306 вторичного видео в основном TS.
PID назначаются элементарным потокам 311R, ..., 312D, например, следующим образом. Потокам 311R и 311D первичного видео являются, соответственно, назначаются значения 0x1012 и 0x1013. Когда до 32 других элементарных потоков могут быть мультиплексированы по типу в одном суб-TS, потокам 312R и 312D вторичного видео назначается любое значение от 0x1B20 до 0x1B3F.
Фиг. 4 является схематичным представлением, показывающим компоновку TS-пакетов в мультиплексированных потоковых данных 400. Основной TS и суб-TS совместно используют эту структуру пакетов. В мультиплексированных потоковых данных 400, элементарные потоки 401, 402, 403 и 404, соответственно, преобразуются в последовательности TS-пакетов 421, 422, 423 и 424. Например, в видеопотоке 401, каждый кадр 401A или каждое поле сначала преобразуется в один пакет 411 пакетированных элементарных потоков (PES). Затем, каждый PES-пакет 411, в общем, преобразуется во множество TS-пакетов 421. Аналогично, аудиопоток 402, PG-поток 403 и IG-поток 404, соответственно, сначала преобразуются в последовательность PES-пакетов 412, 413 и 414, после чего они преобразуются в последовательность TS-пакетов 422, 423 и 424. В завершение, TS-пакеты 421, 422, 423 и 424, полученные из элементарных потоков 401, 402, 403 и 404, мультиплексируются во времени в один фрагмент потоковых данных, т.е. основной TS 400.
Фиг. 5B является схематичным представлением, показывающим последовательность TS-пакетов, составляющую мультиплексированные потоковые данные. Каждый TS-пакет 501 имеет длину в 188 байтов. Как показано на фиг. 5B, каждый TS-пакет 501 включает в себя TS-заголовок 501H и либо одно, либо оба из рабочих TS-данных 501P и поля 501A адаптации (в дальнейшем сокращенно как "AD-поля"). Рабочие TS-данные 501P и AD-поле 501A вместе составляют область данных длиной в 184 байта. Рабочие TS-данные 501P используются в качестве области хранения для PES-пакета. PES-пакеты 411-414, показанные на фиг. 4, типично разделяются на множество частей, и каждая часть сохраняется в различных рабочих TS-данных 501P. AD-поле 501A является областью для сохранения заполняющих байтов (т.е. фиктивных данных), когда объем данных в рабочих TS-данных 501P не достигает 184 байтов. Дополнительно, когда TS-пакетом 501 является, например, PCR, как описано ниже, AD-поле 501A используется для того, чтобы сохранять эту информацию. TS-заголовок 501H является областью данных длиной в четыре байта.
Фиг. 5A является схематичным представлением, показывающим структуру данных TS-заголовка 501H. Как показано на фиг. 5A, TS-заголовок 501H включает в себя TS-приоритет (transport_priority) 511, PID 512 и управление 513 AD-полем (adaptation_field_control). PID 512 указывает PID для элементарного потока, данные которого сохраняются в рабочих TS-данных 501P TS-пакета 501, содержащего PID 512. TS-приоритет 511 указывает степень приоритета TS-пакета 501 для TS-пакетов, которые совместно используют значение, указываемое посредством PID 512. Управление 513 AD-полем указывает то, содержит или нет TS-пакет 501 AD-поле 501A и/или рабочие TS-данные 501P. Например, если управление 513 AD-полем указывает "1", то TS-пакет 501 не включает в себя AD-поле 501A, но включает в себя рабочие TS-данные 501P. Если управление 513 AD-полем указывает "2", то применимо обратное. Если управление 513 AD-полем указывает "3", то TS-пакет 501 включает в себя как AD-поле 501A, так и рабочие TS-данные 501P.
Фиг. 5C является схематичным представлением, показывающим формирование последовательности исходных пакетов, состоящей из последовательности TS-пакетов для мультиплексированных потоковых данных. Как показано на фиг. 5C, каждый исходный пакет 502 имеет длину в 192 байта и включает в себя один TS-пакет 501, показанный на фиг. 5B, и заголовок 502H длиной в четыре байта (TP_Extra_Header). Когда TS-пакет 501 записывается на BD-ROM-диске 101, исходный пакет 502 составляется посредством присоединения заголовка 502H к TS-пакету 501. Заголовок 502H включает в себя ATS (Arrival_Time_Stamp). "ATS" - это информация времени, используемая посредством устройства 102 воспроизведения следующим образом. Когда исходный пакет 502 отправляется из BD-ROM-диска 101 в декодер системных целевых объектов в устройстве 102 воспроизведения, TS-пакет 502P извлекается из исходного пакета 502 и передается в PID-фильтр в декодере системных целевых объектов. ATS в заголовке 502H указывает время, в которое должна начинаться эта передача. "Декодер системных целевых объектов" - это устройство, которое декодирует мультиплексированные потоковые данные один элементарный поток за один раз. Подробности, касающиеся декодера системных целевых объектов и его использования ATS, предоставляются ниже.
Фиг. 5D является схематичным представлением группы секторов, в которую последовательно записана последовательность исходных пакетов 502, в области 202B тома BD-ROM-диска 101. Как показано на фиг. 5D, 32 исходных пакета 502 записываются за один раз как последовательность в три последовательных сектора 521, 522 и 523. Это обусловлено тем, что объем данных для 32 исходных пакетов, т.е. 192 байта×32=6144 байтов, является идентичным общему размеру трех секторов, т.е. 2048 байтов×3=6144 байтов. 32 исходных пакета 502, которые записываются таким образом в трех последовательных секторах 521, 522 и 523, называются "совмещенной единицей" 520. Устройство 102 воспроизведения считывает исходные пакеты 502 из BD-ROM-диска 101 посредством каждой совмещенной единицы 520, т.е. 32 исходных пакета за один раз. Кроме того, группа 521, 522, 523, ... секторов разделяется на 32 фрагмента по порядку с начала, и каждый из них формирует один блок 530 кодов коррекции ошибок. BD-ROM-накопитель 121 выполняет обработку коррекции ошибок для каждого ECC-блока 530.
<<Структура данных PG-потока>>
Фиг. 6 является принципиальной схемой, показывающей структуру данных PG-потока 600. Как показано на фиг. 6, PG-поток 600 включает в себя множество записей данных #1, #2, ... Каждая запись данных представляет единицу отображения (набор для отображения) PG-потока 600 и состоит из данных, которые необходимы для устройства 102 воспроизведения, чтобы формировать одну графическую плоскость. Здесь "графическая плоскость" является данными плоскости, сформированными из графических данных, представляющих двумерные графические изображения. "Данные плоскости" являются двумерным массивом пикселных данных. Размер матрицы является идентичным разрешению видеокадра. Набор пикселных данных формируется посредством комбинации значения координаты цветности и значения α (непрозрачности). Значение координаты цветности выражается как RGB-значение или YCrCb-значение. Типы графических плоскостей включают в себя PG-плоскость, IG-плоскость, плоскость изображений и плоскость экранного меню (OSD). PG-плоскость формируется из PG-потока в основном TS. IG-плоскость формируется из IG-потока в основном TS. Плоскость изображений формируется в соответствии с BD-J-объектом. OSD-плоскость формируется в соответствии с микропрограммным обеспечением в устройстве 102 воспроизведения.
Снова ссылаясь на фиг. 6, каждая запись данных включает в себя множество функциональных сегментов. Эти функциональные сегменты включают в себя, в порядке от начала, сегмент управления представлением (PCS), сегмент задания окна (WDS), сегмент задания палитры (PDS) и сегмент задания объекта (ODS).
WDS задает прямоугольную область в графической плоскости, т.е. окно. Более конкретно, WDS включает в себя идентификатор 611 окна, позицию 612 окна и размер 613 окна. Идентификатор 611 окна является идентификационной информацией (идентификатором) WDS. Позиция 612 окна указывает позицию окна в графической плоскости, например, посредством координат верхнего левого угла окна. Размер 613 окна указывает высоту и ширину окна.
PDS задает соответствие между предварительно определенным типом идентификатора цвета и значением координаты цветности (например, сигнал яркости Y, вычитание Cr из красного сигнала яркости, вычитание Cb из синего сигнала яркости, непрозрачность α). В частности, PDS включает в себя идентификатор 621 палитры и таблицу 622 преобразования цветов (CLUT). Палитра ED 621 является идентификатором PDS. CLUT 622 является таблицей, показывающей список цветов, которые могут использоваться в рендеринге графического объекта. В CLUT 622 могут быть зарегистрированы 256 цветов, при этом идентификаторы цветов от "0" до "255" назначаются соответствующим 256 цветам. Следует отметить, что идентификатор цвета=255 постоянно назначается "бесцветному прозрачному".
В общем, множество ODS представляют один графический объект. "Графический объект" является данными, которые представляют графическое изображение посредством соответствия между пикселным кодом и идентификатором цвета. Графический объект разделяется на части после того, как он сжимается посредством способа кодирования по длинам серий, и части распространяются в каждый ODS. Каждый ODS дополнительно включает в себя идентификатор объекта, а именно, идентификатор графического объекта.
PCS показывает подробности набора для отображения, который принадлежит одной записи данных и, в частности, задает структуру экрана, которая использует графические объекты. Типы структуры экрана включают в себя врезку/вырезку, выход из затемнения/затемнение, изменение цвета, прокрутку и вытеснение/стирание. В частности, PCS включает в себя позицию 601 отображения объекта, информацию 602 кадрирования, идентификатор 603 опорного окна, идентификатор 604 опорной палитры и идентификатор 605 опорного объекта. Позиция 601 отображения объекта указывает позицию в графической плоскости, в которой графический объект должен отображаться, например, координаты верхнего левого угла области, в которой должен отображаться графический объект. Информация 602 кадрирования указывает диапазон прямоугольной части, которая должна вырезаться из графического объекта посредством процесса кадрирования. Диапазон задается, например, посредством координат верхнего левого угла, высоты и ширины. Фактически, часть может подготавливаться посредством рендеринга в позиции, указываемой посредством позиции 601 отображения объекта. Идентификатор 603 опорного окна, идентификатор 604 опорной палитры и идентификатор 605 опорного объекта указывают идентификаторы WDS, PDS и графического объекта, к которым следует обращаться в процессе рендеринга графического объекта, соответственно. Поставщик содержимого указывает структуру экрана в устройство 102 воспроизведения посредством использования этих параметров в PCS. Это дает возможность устройству 102 воспроизведения реализовывать эффект отображения, посредством которого "определенный субтитр постепенно исчезает, и следующий субтитр отображается".
<<Структура данных IG-потока>>
Ссылаясь снова на фиг. 4, IG-поток 404 включает в себя сегмент интерактивной структуры (ICS), PDS и ODS. PDS и ODS являются функциональными сегментами, идентичными функциональным сегментам, включенным в PG-поток 403. В частности, графический объект, который включает в себя ODS, представляет графический элемент GUI, такой как кнопка, всплывающее меню и т.д., который формирует интерактивный экран. ICS задает интерактивный режим работы, который использует эти графические объекты. В частности, ICS задает состояния, которые каждый графический объект, такой как кнопка, всплывающее меню и т.д., может принимать, когда изменяется в ответ на пользовательскую операцию, состояния, такие как обычное, выбранное и активное. ICS также включает в себя информацию кнопок. Информация кнопок включает в себя команду, которую должно выполнять устройство воспроизведения, когда пользователь выполняет определенную операцию с кнопкой и т.п.
<<Структура данных видеопотока>>
Каждое из изображений, включенных в видеопоток, представляет один кадр или одно поле и сжимается посредством способа кодирования со сжатием видео, такого как MPEG-2, MPEG-4 AVC и т.д. Это сжатие использует пространственную или временную избыточность изображения. Здесь, кодирование изображений, которое использует только пространственную избыточность изображения, упоминается как "внутрикадровое кодирование". С другой стороны, кодирование изображений, которое использует временную избыточность, т.е. подобие между данными для множества изображений, отображаемых последовательно, упоминается как "межкадровое прогнозирующее кодирование". При межкадровом прогнозирующем кодировании, прежде всего, изображение ранее или позднее по времени представления назначается изображению, которое должно быть кодировано, в качестве опорного изображения. Затем, вектор движения обнаруживается между изображением, которое должно быть кодировано, и опорным изображением, и после этого компенсация движения выполняется для опорного изображения с использованием вектора движения. Кроме того, значение разности между изображением, полученным посредством компенсации движения, и изображением, которое должно быть кодировано, находится, и временная избыточность удаляется с использованием значения разности. Таким образом, объем данных для каждого изображения сокращается.
Фиг. 7 является схематичным представлением, показывающим изображения в видеопотоке 701 для воспроизведения базового вида и в видеопотоке 902 для просмотра правым глазом в порядке времени представления. Как показано на фиг. 7, видеопоток 701 для воспроизведения базового вида включает в себя изображения 710, 711, 712, ..., 719 (в дальнейшем "изображения для воспроизведения базового вида"), а видеопоток 702 для просмотра правым глазом включает в себя изображения 720, 721, 722, ..., 729 (в дальнейшем "изображения для просмотра правым глазом"). Изображения 710-719 для воспроизведения базового вида типично разделяются на множество GOP 731 и 732. "GOP" упоминается как последовательность изображений, имеющая I-изображение в начале последовательности. В дополнение к I-изображению, GOP типично включает в себя P-изображения и B-изображения. Здесь, "I (внутреннее) изображение" относится к изображению, сжатому посредством внутрикадрового кодирования. "P (прогнозирующее) изображение" относится к изображению, сжатому посредством межкадрового прогнозирующего кодирования посредством использования другого изображения, время представления которого находится до времени представления изображения, в качестве опорного изображения. "B (двунаправленно прогнозирующее) изображение" относится к изображению, сжатому посредством межкадрового прогнозирующего кодирования посредством использования двух изображений, времена представления которых находятся до или после времени представления изображения, в качестве опорных изображений. В частности, B-изображение, которое используется в качестве опорного изображения для другого изображения в межкадровом прогнозирующем кодировании, упоминается как "Br (опорное B) изображение".
В примере, показанном на фиг. 7, изображения для воспроизведения базового вида в GOP 731 и 732 сжимаются в следующем порядке. В первой GOP 731, первое изображение сжимается как I0-изображение 710. Число в подстрочном индексе указывает порядковый номер, выделенный каждому изображению в порядке времени представления. Затем, четвертое изображение для воспроизведения базового вида сжимается как P3-изображение 713 с использованием I0-изображения 710 в качестве опорного изображения. Стрелки, показанные на фиг. 7, указывают то, что изображение на острие стрелки является опорным изображением для изображения на конце стрелки. Затем, второе и третье изображения для воспроизведения базового вида, соответственно, сжимаются как Br1-изображение 711 и Br2-изображение 712 с использованием как I0-изображения 710, так и P3-изображения 713 в качестве опорных изображений. Кроме того, седьмое изображение для воспроизведения базового вида сжимается как P6-изображение 716 с использованием P3-изображения 713 в качестве опорного изображения. Затем, четвертое и пятое изображения для воспроизведения базового вида, соответственно, сжимаются как Br4-изображение 714 и Br5-изображение 715 с использованием как P3-изображения 713, так и P6-изображения 716 в качестве опорных изображений. Аналогично, во второй GOP 732, первое изображение сначала сжимается как I7-изображение 717. Затем, третье изображение сжимается как P9-изображение 719 с использованием I7-изображения 717 в качестве опорного изображения. Затем, второе изображение для воспроизведения базового вида сжимается как Br8-изображение 718 с использованием как I7-изображения 717, так и P9-изображения 719 в качестве опорных изображений.
В видеопотоке 701 для воспроизведения базового вида, каждая GOP 731 и 732 всегда содержит I-изображение в начале, и тем самым изображения для воспроизведения базового вида могут быть декодированы на основе GOP. Например, в первой GOP 731, I0-изображение 710 сначала декодируется независимо. Затем, P3-изображение 713 декодируется с использованием декодированного I0-изображения 710. Затем Br1-изображение 711 и Br2-изображение 712 декодируются с использованием как декодированного I0-изображения 710, так и P3-изображения 713. Последующая группа 714, 715, ..., изображений аналогично декодируется. Таким образом, видеопоток 701 для воспроизведения базового вида может быть декодирован независимо и, кроме того, к нему может произвольно осуществляться доступ в единицах GOP.
Как дополнительно показано на фиг. 7, изображения 720-729 для просмотра правым глазом сжимаются посредством межкадрового прогнозирующего кодирования. Тем не менее, способ кодирования отличается от способа кодирования для изображений 710-719 для воспроизведения базового вида, поскольку в дополнение к избыточности во временной избыточности видеоизображений, избыточность между левыми и правыми видеоизображениями также используется. В частности, как показано посредством стрелок на фиг. 7, опорное изображение для каждого из изображений 720-729 для просмотра правым глазом выбирается не из видеопотока 702 для просмотра правым глазом, а вместо этого из видеопотока 701 для воспроизведения базового вида. В частности, время представления является практически идентичным для каждого из изображений 720-729 для просмотра правым глазом и соответствующего изображения для воспроизведения базового вида, выбранного в качестве опорного изображения. Эти изображения представляют вид для просмотра правым глазом и вид для просмотра левым глазом для идентичной сцены трехмерного видеоизображения, т.е. параллактического видеоизображения. Изображения 720-729 для просмотра правым глазом и изображения 710-719 для воспроизведения базового вида находятся тем самым в соответствии "один-к-одному". В частности, GOP-структура является идентичной для этих изображений.
В примере, показанном на фиг. 7, первое изображение для просмотра правым глазом в первой GOP 731 сжимается как P0-изображение 720 с использованием I0-изображения 710 в видеопотоке 701 для воспроизведения базового вида в качестве опорного изображения. Эти изображения 710 и 720 представляют вид для просмотра левым глазом и вид правым глазом первого кадра в трехмерных видеоизображениях. Затем, четвертое изображение для просмотра правым глазом сжимается как P3-изображение 723 с использованием P3-изображения 713 в видеопотоке 701 для воспроизведения базового вида и P0-изображения 720 в качестве опорных изображений. Затем, второе изображение для просмотра правым глазом сжимается как B1-изображение 721 с использованием Br1-изображения 711 в видеопотоке 701 для воспроизведения базового вида в дополнение к P0-изображению 720 и P3-изображению 723 в качестве опорных изображений. Аналогично, третье изображение для просмотра правым глазом сжимается как B2-изображение 722 с использованием Br2-изображения 712 в видеопотоке 701 для воспроизведения базового вида в дополнение к P0-изображению 720 и P3-изображению 730 в качестве опорных изображений. Для каждого из оставшихся изображений 724-729 для просмотра правым глазом, изображение для воспроизведения базового вида со временем представления, практически идентичным времени представления изображения для просмотра правым глазом, аналогично используется в качестве опорного изображения.
Пересмотренные стандарты для MPEG-4 AVC/H.264, называемые кодированием многовидового видео (MVC), известны в качестве способа кодирования со сжатием видео, который использует корреляцию между левым и правым видеоизображениями, как описано выше. MVC создан в июле 2008 года объединенной группой по видеостандартам (JVT), совместным проектом ISO/IEC MPEG и ITU-T VCEG, и является стандартом для совместного кодирования видео, которое может быть видимым с множества ракурсов. В MVC предусмотрено не только временное подобие в видеоизображениях, используемых для межкадрового прогнозирующего кодирования видео, но также и подобие между видеоизображениями с различающихся ракурсов. Этот тип прогнозирующего кодирования имеет более высокий коэффициент сжатия видео, чем прогнозирующее кодирование, которое по отдельности сжимает данные видеоизображений, видимых с каждого ракурса.
Как описано выше, изображение для воспроизведения базового вида используется в качестве опорного изображения для сжатия каждого из изображений 720-729 для просмотра правым глазом. Следовательно, в отличие от видеопотока 701 для воспроизведения базового вида, видеопоток 702 для просмотра правым глазом не может быть декодирован независимо. С другой стороны, тем не менее, разность между параллактическими видеоизображениями является, в общем, очень небольшой, т.е. корреляция между видом для просмотра левым глазом и видом для просмотра правым глазом является высокой. Соответственно, изображения для просмотра правым глазом, в общем, имеют значительно более высокую скорость сжатия, чем изображения для воспроизведения базового вида, что означает, что объем данных значительно меньше.
Карты глубины, включенные в поток карт глубины, находятся в соответствии "один-к-одному" с изображениями 710-719 для воспроизведения базового вида, и каждая представляет карту глубины для двумерного видеоизображения в соответствующем изображении для воспроизведения базового вида. Карты глубины сжимаются посредством способа кодирования со сжатием видео, такого как MPEG-2, MPEG-4 AVC и т.д., аналогичным образом изображениям 710-719 для воспроизведения базового вида. В частности, межкадровое прогнозирующее кодирование используется в этом способе кодирования. Другими словами, каждая карта глубины сжимается с использованием другой карты глубины в качестве опорного изображения. Боле того, поток карт глубины разделяется на единицы GOP способом, аналогичным видеопотоку 701 для воспроизведения базового вида, и каждая GOP всегда содержит I-изображение в начале. Соответственно, карты глубины могут быть декодированы на основе GOP. Тем не менее, поскольку сама карта глубины является информацией, представляющей только глубину каждой части двумерного видеоизображения попикселно, поток карт глубины не может использоваться независимо для воспроизведения видеоизображений.
Например, аналогично двум потокам 311R и 311D первичного видео, показанным на фиг. 3B, видеопоток для просмотра правым глазом и поток карт глубины, которые соответствуют одному видеопотоку для воспроизведения базового вида, сжимаются с использованием одного способа кодирования. Например, если видеопоток для просмотра правым глазом кодируется в MVC-формате, поток карт глубины также кодируется в MVC-формате. В этом случае, во время воспроизведения трехмерных видеоизображений устройство 102 воспроизведения может плавно переключаться между L/R-режимом и режимом глубины при сохранении постоянного способа кодирования.
Фиг. 8 является схематичным представлением, показывающим подробности относительно структуры данных видеопотока 800. Эта структура данных является практически идентичной для видеопотока для воспроизведения базового вида и видеопотока для воспроизведения зависимого вида. Как показано на фиг. 8, видеопоток 800 является, в общем, состоящим из множества видеопоследовательностей #1, #2, ... "Видеопоследовательность" - это комбинация изображений 811, 812, 813, 814, ..., которые составляют одну GOP 810 и к которым по отдельности присоединена дополнительная информация, такая как заголовок. Комбинация этой дополнительной информации и изображения упоминается как "единица видеодоступа (VAU)". Таким образом, в GOP 810 и 820, одна VAU #1, #2, ... формируется для каждого изображения. Каждое изображение может считываться из видеопотока 800 в единицах VAU.
Фиг. 8 дополнительно показывает структуру VAU #1 831, расположенной в начале каждой видеопоследовательности в видеопотоке для воспроизведения базового вида. VAU #1 831 включает в себя идентификационный код 831A единицы доступа (AU), заголовок 831B последовательности, заголовок 831C изображения, дополнительные данные 831D и данные 831E сжатых изображений. За исключением невключения заголовка 831B последовательности, VAU со второй VAU #2 и далее имеет структуру, идентичную структуре VAU #1 831. Идентификационный код 831A AU является предварительно определенным кодом, указывающим начало VAU #1 831. Заголовок 831B последовательности, также называемый GOP-заголовком, включает в себя идентификационный номер для видеопоследовательности #1, которая включает в себя VAU #1 831. Заголовок 831B последовательности дополнительно включает в себя информацию, совместно используемую посредством всей GOP 810, к примеру, разрешение, частота кадров, соотношение сторон и скорость передачи битов. Заголовок 831C изображения указывает собственный идентификационный номер, идентификационный номер для видеопоследовательности #1 и информацию, необходимую для декодирования изображения, такую как тип способа кодирования. Дополнительные данные 831D включают в себя дополнительную информацию, касающуюся вопросов, отличных от декодирования изображения, например, текстовую информацию субтитров, информацию о GOP-структуре и информацию временного кода. В частности, дополнительные данные 831D включают в себя информацию переключения декодирования (более детальное описание представлено ниже). Множество фрагментов дополнительных данных 831D могут быть набором в одной VAU, в зависимости от типа данных, заключенных в ней. Данные 831E сжатых изображений включают в себя изображение для воспроизведения базового вида. Дополнительно, VAU #1 831 может включать в себя любое или все из дополняющих данных 831F, кода 831G конца последовательности и кода 831H конца потока в зависимости от необходимости. Дополняющие данные 831F являются фиктивными данными. Посредством регулирования размера дополняющих данных 831F в соответствии с размером данных 831E сжатых изображений, скорость передачи битов VAU #1 831 может поддерживаться равной предварительно определенному значению. Код 831G конца последовательности указывает то, что VAU #1 831 находится в конце видеопоследовательности #1. Код 831H конца потока указывает конец видеопотока 800 для воспроизведения базового вида.
Фиг. 8 также показывает структуру VAU #1 832, расположенной в начале каждой видеопоследовательности в видеопотоке для воспроизведения зависимого вида. VAU #1 832 включает в себя идентификационный код 832A суб-AU, заголовок 832B подпоследовательности, заголовок 832C изображения, дополнительные данные 832D и данные 832E сжатых изображений. За исключением невключения заголовка 832B подпоследовательности, VAU со второй VAU #2 и далее имеет структуру, идентичную структуре VAU #1 832. Идентификационный код 832A суб-AU является предварительно определенным кодом, указывающим начало VAU #1 832. Заголовок 832B подпоследовательности включает в себя идентификационный номер для видеопоследовательности #1, которая включает в себя VAU #1 832. Заголовок 832B подпоследовательности дополнительно включает в себя информацию, совместно используемую посредством всей GOP 810, к примеру, разрешение, частота кадров, соотношение сторон и скорость передачи битов. Эти значения являются идентичными значениям, заданным для соответствующей GOP в видеопотоке для воспроизведения базового вида, т.е. значениям, показанным посредством заголовка 831B последовательности в VAU #1 831. Заголовок 832C изображения указывает собственный идентификационный номер, идентификационный номер для видеопоследовательности #1 и информацию, необходимую для декодирования изображения, такую как тип способа кодирования. Дополнительные данные 832D включают в себя только метаданные смещения (более подробное описание приведено ниже). Здесь, дополнительные данные 832D являются одним типом дополнительных данных, и существуют другие типы дополнительных данных, которые включают в себя дополнительную информацию, касающуюся вопросов, отличных от декодирования изображения, например, текстовую информацию субтитров, информацию о GOP-структуре, информацию временного кода и информацию переключения декодирования. Данные 832E сжатых изображений включают в себя изображение для воспроизведения зависимого вида. Дополнительно, VAU #1 832 может включать в себя любое или все из дополняющих данных 832F, кода 832G конца последовательности и кода 832H конца потока в зависимости от необходимости. Дополняющие данные 832F являются фиктивными данными. Посредством регулирования размера дополняющих данных 832F в соответствии с размером данных 832E сжатых изображений, скорость передачи битов VAU #1 832 может поддерживаться равной предварительно определенному значению. Код 832G конца последовательности указывает то, что VAU #1 832 находится в конце видеопоследовательности #1. Код 832H конца потока указывает конец видеопотока 800 для воспроизведения зависимого вида.
Конкретное содержимое каждого компонента в VAU отличается согласно способу кодирования видеопотока 800. Например, когда способом кодирования является MPEG-4 AVC или MVC, компоненты в VAU, показанных на фиг. 8, состоят из одного модуля уровня абстрагирования от сети (NAL). В частности, идентификационный код 831A AU, заголовок 831B последовательности, заголовок 831C изображения, дополнительные данные 831D, данные 831E сжатых изображений, дополняющие данные 831F, код 831G конца последовательности и код 831H конца потока надлежащим образом соответствуют разделителю единиц доступа (AU), набору параметров последовательности (SPS), набору параметров изображения (PPS), дополнительной улучшающей информации (SEI) компоненту вида, данным фильтрации, концу последовательности и концу потока. В частности, в VAU #1 832, дополнительные данные 832D, включающие в себя метаданные смещения, состоят из одной NAL-единицы, причем NAL-единица не включает в себя данные, отличные от метаданных смещения.
Фиг. 9 является схематичным представлением, показывающим подробности относительно способа для сохранения видеопотока 901 в последовательность 902 PES-пакетов. Этот способ хранения является идентичным для видеопотока для воспроизведения базового вида и видеопотока для воспроизведения зависимого вида. Как показано на фиг. 9, в фактическом видеопотоке 901 изображения мультиплексируются в порядке кодирования, а не в порядке времени представления. Например, в VAU в видеопотоке для воспроизведения базового вида, как показано на фиг. 9, I0-изображение 910, P3-изображение 911, B1-изображение 912, B2-изображение 913, ..., сохраняются по порядку с начала. Число в подстрочном индексе указывает порядковый номер, выделенный каждому изображению по порядку времени представления. I0-изображение 910 используется в качестве опорного изображения для кодирования P3-изображения 911, и I0-изображение 910 и P3-изображение 911 используются в качестве опорных изображений для кодирования B1-изображения 912 и B2-изображения 913. Каждая из этих VAU сохраняется как различный PES-пакет 920, 921, 922, 923, ... Каждый PES-пакет 920, ... включает в себя рабочие PES-данные 920P и PES-заголовок 920H. Каждая VAU сохраняется в рабочих PES-данных 920P. Каждый PES-заголовок 920H включает время представления (временную метку представления, или PTS) и время декодирования (временную метку декодирования, или DTS) для изображения, сохраненного в рабочих PES-данных 920P, в один PES-пакет 920.
Как и в случае с видеопотоком 901, показанным на фиг. 9, другие элементарные потоки, показанные на фиг. 3 и 4, сохраняются в рабочих PES-данных в последовательности PES-пакетов. Кроме того, PES-заголовок в каждом PES-пакете включает в себя PTS для данных, хранимых в рабочих PES-данных для PES-пакета.
Фиг. 10 является принципиальной схемой, показывающей соответствие между PTS и DTS, назначенными каждому изображению в видеопотоке 1001 для воспроизведения базового вида и видеопотоке 1002 для воспроизведения зависимого вида. Как показано на фиг. 10, для видеопотоков 1001 и 1002 идентичные PTS и DTS назначаются паре изображений, представляющих идентичный кадр или поле в трехмерном видеоизображении. Например, первый кадр или поле в трехмерном видеоизображении подготавливается посредством рендеринга из комбинации I1-изображения 1011 в видеопотоке 1022 для воспроизведения базового вида и P1-изображения 1021 в видеопотоке 1002 для воспроизведения зависимого вида. Соответственно, PTS и DTS для двух изображений 1011 и 1021 являются идентичными. Числа в подстрочном индексе указывают порядковый номер, выделенный каждому изображению по порядку DTS. Кроме того, когда видеопоток 1002 для воспроизведения зависимого вида - это поток карт глубины, P1-изображение 1021, заменяется I-изображением, представляющим карту глубины для I1-изображения 1011. Аналогично, PTS и DTS для пары вторых изображений в видеопотоках 1001 и 1002, т.е. P2-изображений 1012 и 1022, являются идентичными. PTS и DTS являются идентичными для пары третьих изображений в видеопотоках 1001 и 1002, т.е. Br3-изображения 1013 и B3-изображения 1023. Это также применимо к паре из Br4-изображения 1014 и B4-изображения 1024.
Пара VAU, которые включают в себя изображения, для которых PTS и DTS являются идентичными для видеопотока 1001 для воспроизведения базового вида и видеопотока 1002 для воспроизведения зависимого вида, называется "трехмерной VAU". Посредством использования выделения PTS и DTS, показанных на фиг. 10, просто инструктировать декодеру в устройстве 102 воспроизведения в режиме трехмерного воспроизведения обрабатывать видеопоток 1001 для воспроизведения базового вида и видеопоток 1002 для воспроизведения зависимого вида параллельно в единицах трехмерных VAU. Таким образом, декодер определенно параллельно обрабатывает пару изображений, представляющих один кадр или поле в трехмерном видеоизображении. Кроме того, заголовок последовательности в трехмерной VAU в начале каждой GOP включает в себя одинаковое разрешение, одинаковую частоту кадров и одинаковое соотношение сторон. В частности, эта частота кадров равна значению, когда видеопоток 1001 для воспроизведения базового вида декодируется независимо в режиме двумерного воспроизведения.
[Метаданные смещения]
Фиг. 11 является схематичным представлением, показывающим структуру данных для метаданных 1110 смещения, включенных в видеопоток 1100 для воспроизведения зависимого вида. Фиг. 12 является таблицей, показывающей синтаксис этих метаданных 1110 смещения. Как показано на фиг. 11, метаданные 1110 смещения сохраняются в дополнительных данных 1101 VAU #1, расположенной в начале каждой видеопоследовательности (т.е. каждой GOP). Как показано на фиг. 11 и 12, метаданные 1110 смещения включают в себя PTS 1111, идентификаторы 1112 последовательностей смещений и последовательности 1113 смещений. PTS 1111 является идентичной PTS кадра, представленного посредством данных сжатых изображений в VAU #1, а именно, PTS первого кадра каждой GOP.
Идентификаторы 1112 последовательностей смещений являются порядковыми номерами 0, 1, 2, ... M, выделяемыми по порядку для последовательностей 1313 смещений. Буква M представляет целое число, превышающее или равное 1, и указывает общее число последовательностей 1113 смещений (number_of_offset_sequence). Идентификатор 1112 последовательности смещений выделяется для каждой графической плоскости, которая должна быть комбинирована в видеоплоскости. Таким образом, последовательность 1113 смещений ассоциирована с каждой графической плоскостью. Здесь "видеоплоскость" упоминается как данные плоскости, сформированные из изображения, включенного в видеопоследовательность, а именно, двумерный массив пикселных данных. Размер матрицы является идентичным разрешению видеокадра. Набор пикселных данных формируется посредством комбинации значения координаты цветности (RGB-значения или YCrCb-значения) и значения α.
Каждая последовательность 1113 смещений является таблицей соответствия между номерами 1121 кадров и информацией 1122 и 1123 смещения. Номера 1121 кадров являются порядковыми номерами 1, 2, ..., N, выделяемыми в порядке представления для кадров #1, #2, ..., N, представленных посредством одной видеопоследовательности (например, видеопоследовательности #1). На фиг. 11, номер 1121 кадра представляется как целочисленная переменная "i". Буква N представляет целое число, превышающее или равное единице, и указывает общее число кадров, включенных в видеопоследовательность (number_of_displayed_frames_in_GOP). Фрагменты информации 1122 и 1123 смещения являются управляющей информацией, задающей управление смещением для одной графической плоскости.
"Управление смещением" упоминается как процесс, чтобы предоставлять смещения влево и вправо для горизонтальных координат в графической плоскости и комбинировать результирующие плоскости, соответственно, с видеоплоскостью для воспроизведения базового вида и видеоплоскостью для воспроизведения зависимого вида. "Предоставление горизонтальных смещений для графической плоскости" упоминается как горизонтальный сдвиг каждого фрагмента пикселных данных в графической плоскости. Из одной графической плоскости это формирует пару графических плоскостей, представляющих вид для просмотра левым глазом и вид для просмотра правым глазом. Позиция представления каждого элемента в двумерных графических изображениях, воспроизводимых из этой пары плоскостей, сдвигается влево или право от исходной позиции представления. Зритель принудительно воспринимает пару вида для просмотра левым глазом и вида для просмотра правым глазом как одно трехмерное графическое изображение вследствие бинокулярного параллакса, сформированного посредством этих сдвигов.
Смещение определяется посредством направления и размера. Соответственно, как показано на фиг. 11 и 12, каждый фрагмент информации смещения включает в себя направление 1122 смещения (Plane_offset_direction) и значение 1123 смещения (Plane_offset_value). Направление 1122 смещения указывает то, ближе или дальше трехмерное графическое изображение к зрителю, чем экран. То, сдвинута или нет позиция представления в виде для просмотра левым глазом и виде для просмотра правым глазом влево или вправо от исходной позиции представления двумерного графического изображения, зависит от значения направления 1122 смещения. Значение 1123 смещения указывает число горизонтальных пикселов для расстояния между исходной позицией представления двумерного графического изображения и позицией представления каждого из вида для просмотра левым глазом и вида для просмотра правым глазом.
Фиг. 13A и 13B являются схематичными представлениями, показывающими управление смещениями для PG-плоскости 1310 и IG-плоскости 1320, соответственно. Через это управление смещениями два типа графических плоскостей, 1310 и 1320, соответственно, комбинируются с видеоплоскостью 1301 для просмотра левым глазом и видеоплоскостью 1302 для просмотра правым глазом. "Видеоплоскость для просмотра левым глазом/для просмотра правым глазом" упоминается как видеоплоскость, которая представляет вид для просмотра левым глазом/вид для просмотра правым глазом и формируется из комбинации видеопотока для воспроизведения базового вида и видеопотока для воспроизведения зависимого вида. В последующем описании, допускается, что субтитр 1311, указываемый посредством PG-плоскости 1310, отображается ближе экрана, а кнопка 1321, указываемая посредством IG-плоскости 1320, отображается дальше экрана.
Как показано на фиг. 13A, смещение вправо предоставляется в PG-плоскость 1310. В частности, позиция каждого фрагмента пикселных данных в PG-плоскости 1310 сначала сдвигается вправо (виртуально) от соответствующей позиции пикселных данных в видеоплоскости 1301 для просмотра левым глазом на число пикселов SFP, равное значению смещения. Затем, полоса 1512, (виртуально) выступающая из правого края диапазона видеоплоскости 1301 для просмотра "левым глазом", отрезается от правого края PG-плоскости 1310. Другими словами, пикселные данные для этой области 1312 отбрасываются. Вместо этого, прозрачная полоса 1513 добавляется к левому краю PG-плоскости 1310. Ширина этой полосы 1513 является шириной полосы 1512 на правом краю; т.е. ширина является идентичной значению SFP смещения. PG-плоскость, представляющая вид для просмотра левым глазом, тем самым формируется из PG-плоскости 1310 и комбинируется с видеоплоскостью 1301 для просмотра левым глазом. В частности, в этой PG-плоскости для просмотра левым глазом, позиция представления субтитра 1311 сдвигается вправо от исходной позиции представления посредством значения SFP смещения.
В отличие от этого, смещение влево предоставляется в IG-плоскость 1320. В частности, позиция каждого фрагмента пикселных данных в IG-плоскости 1320 сначала сдвигается влево (виртуально) от соответствующей позиции пикселных данных в видеоплоскости 1301 для просмотра левым глазом на число пикселов SFI, равное значению смещения. Затем, полоса 1322, (виртуально) выступающая из левого края диапазона видеоплоскости для просмотра левым глазом 1310, отрезается от левого края IG-плоскости 1320. В отличие от этого, прозрачная полоса 1323 добавляется к правому краю IG-плоскости 1320. Ширина этой полосы 1323 является шириной полосы 1322 на левом краю; т.е. ширина является идентичной значению смещения SFI. IG-плоскость, представляющая вид для просмотра левым глазом, тем самым формируется из IG-плоскости 1320 и комбинируется с видеоплоскостью 1301 для просмотра левым глазом. В частности, в этой IG-плоскости для просмотра левым глазом, позиция представления кнопки 1321 сдвигается влево от исходной позиции представления посредством значения смещения SFI.
Как показано на фиг. 13B, смещение влево предоставляется в PG-плоскость 1310, а смещение вправо добавляется к IG-плоскости 1320. Другими словами, вышеуказанные операции выполняются наоборот для PG-плоскости 1310 и IG-плоскости 1320. Как результат, данные плоскости, представляющие вид для просмотра правым глазом, формируются из данных 1310 и 1320 плоскости и комбинируются с видеоплоскостью 1320 для просмотра правым глазом. В частности, в PG-плоскости для просмотра правым глазом, позиция представления субтитра 1311 сдвигается влево от исходной позиции представления посредством значения SFP смещения. С другой стороны, в IG-плоскости для просмотра правым глазом, позиция представления кнопки 1321 сдвигается вправо от исходной позиции представления посредством значения смещения SFI.
Фиг. 13C является схематичным представлением, показывающим трехмерные графические изображения, которые зрителю 1330 инструктируется воспринимать из двумерных графических изображений, представленных посредством графических плоскостей, показанных на фиг. 13A и 13B. Когда двумерные графические изображения, представленные посредством этих графических плоскостей, поочередно отображаются на экране 1340, зритель 1330 воспринимает, что субтитр 1331 ближе экрана 1340, а кнопка 1332 дальше экрана 1340, как показано на фиг. 13C. Расстояние между трехмерными графическими изображениями 1331 и 1332 и экраном 1340 может регулироваться через значения SFP и SFI смещения.
Фиг. 14A и 14B являются графиками, показывающими примеры последовательностей смещений. На этих графиках значение смещения является положительным, когда направление смещения идет к зрителю от экрана. Фиг. 14A является укрупнением графика для периода представления первой GOP на фиг. 14B, т.е. GOP1. Как показано на фиг. 14A, ступенчатая линия 1401 показывает значения смещения для последовательности смещений с идентификатором последовательности смещений, равным 0, т.е. для последовательности смещений [0]. С другой стороны, горизонтальная линия 1402 показывает значения смещения для последовательности смещений с идентификатором последовательности смещений, равным 1, т.е. для последовательности смещений [1]. Значение 1401 смещения в последовательности смещений [0] увеличивается пошагово в течение периода GOP1 представления первой GOP в порядке кадров FR1, FR2, FR3, ..., FR15, ... Как показано на фиг. 14B, пошаговое увеличение значения 1401 смещения аналогично продолжается в периоды GOP2, GOP3, ..., GOP40, ... представления для второй и последующих GOP. Величина увеличения в расчете на каждый кадр является достаточно небольшим для значения 1401 смещения на фиг. 14B, чтобы казаться непрерывно увеличивающейся как линия. С другой стороны, значение 1402 смещения в последовательности смещений [1] поддерживается постоянным в течение периода GOP1 представления первой GOP. Как показано на фиг. 14B, значение 1402 смещения увеличивается до положительного значения в конце периода GOP40 представления для 40-й GOP. Значения смещения тем самым могут демонстрировать прерывистое изменение.
Фиг. 14C является схематичным представлением, показывающим трехмерные графические изображения, воспроизводимые в соответствии с последовательностями смещений, показанными на фиг. 14A и 14B. Когда трехмерное видеоизображение 1403 субтитра отображается в соответствии с последовательностью смещений [0], трехмерное видеоизображение 1403, как кажется, начинается с точки непосредственно перед экраном 1404 и постепенно приближается к зрителю. С другой стороны, когда трехмерное видеоизображение 1405 кнопки отображается в соответствии с последовательностью смещений [1], трехмерное видеоизображение 1405, как кажется, внезапно перепрыгивает из фиксированной позиции за экраном 1404 в позицию перед экраном 1404. Как описано, шаблоны, посредством которых значения смещения увеличиваются или уменьшаются покадрово, изменяются множеством способов между последовательностями смещений. Отдельные изменения глубины множества трехмерных графических изображений тем самым могут представляться множеством способов.
[Взаимосвязь между метаданными смещения и TS-приоритетом]
Фиг. 15 является принципиальной схемой, показывающей PES-пакет 1510, сохраняющий VAU #1 1500 в видеопотоке для воспроизведения зависимого вида, и последовательность 1520 TS-пакетов, сформированных из PES-пакета 1510. VAU #1 1500 располагается в начале видеопоследовательности, аналогично VAU #1 832, показанной на фиг. 8. Соответственно, по меньшей мере, один фрагмент дополнительных данных 1504, включенный в VAU #1 1500, состоит только из метаданных 1509 смещения. Области со штриховкой на фиг. 15 показывают дополнительные данные 1504, состоящие только из метаданных 1509 смещения. VAU #1 1500 сохраняется в рабочих PES-данных 1512 PES-пакета 1510. PES-заголовок 1511 PES-пакета 1510 включает DTS и PTS, назначенные данным 1505 сжатых изображений, в VAU #1 1500. PES-пакет 5010 сохраняется в последовательности 5020 TS-пакетов в порядке с начала. В этой компоновке, последовательность 1520 TS-пакетов разделяется на три группы 1521, 1522 и 1523 в порядке от начала. Первая группа 1521 включает в себя PES-заголовок 1511, идентификационный код 1501 суб-AU, заголовок 1502 подпоследовательности и заголовок 1503 изображения. Вторая группа 1522 включает в себя только дополнительные данные 1504, состоящие только из метаданных 1509 смещения. Третья группа 1513 включает в себя данные 1505 сжатых изображений, дополняющие данные 1506, код 1507 конца последовательности и код 1508 конца потока. Следует отметить, что дополнительные данные, отличные от метаданных смещения, если включены в VAU #1 1500, сохраняются в первой группе 1521 или третьей группе 1513. TS-пакет 1530, расположенный в конце первой группы 1521, в общем, включает в себя AD-поле 1532. Оно не допускает подмешивания дополнительных данных 1504, состоящих только из метаданных 1509 смещения, в рабочие TS-данные 1533. Аналогично, TS-пакет 1550, расположенный в конце второй группы 1522, в общем, включает в себя AD-поле 1552. Оно не допускает подмешивания данных 1505 сжатых изображений и других данных, отличных от дополнительных данных 1504, состоящих только из метаданных 1509 смещения, в рабочие TS-данные 1553. Таким образом, дополнительные данные 1504, состоящие только из метаданных 1509 смещения, сохраняются только в рабочих TS-данных 1542, 1553 TS-пакетов 1540, 1550, принадлежащих второй группе 1522. С другой стороны, данные 1505 сжатых изображений сохраняются только в рабочих TS-данных 1562 TS-пакетов 1560, принадлежащих третьей группе 1523.
Дополнительно ссылаясь на фиг. 15, TS-заголовки 1531 TS-пакетов 1530, принадлежащих первой группе 1521, указывают значение TS-приоритета, равное "0". Аналогично, TS-заголовки 1561 TS-пакетов 1560, принадлежащих третьей группе 1523, указывают значение TS-приоритета, равное "0". С другой стороны, TS-заголовки 1541, 1551 TS-пакетов 1540, 1550, принадлежащих второй группе 1522, указывают значение TS-приоритета, равное "1". Следует отметить, что эти значения могут задаваться в обратном порядке. Таким образом, TS-пакеты, принадлежащие второй группе 1522, имеют значение TS-приоритета, отличное от TS-пакетов, принадлежащих другим группам 1521 и 1523. Соответственно, декодер системных целевых объектов в устройстве 102 воспроизведения может легко выбирать TS-пакеты, принадлежащие второй группе 1522, посредством использования TS-приоритета.
В отличие от фиг. 15, TS-пакеты, принадлежащие первой группе 1521 и второй группе 1522, могут указывать идентичное значение TS-приоритета. Фиг. 16 является принципиальной схемой, показывающей последовательность TS-пакетов 1620 в этом случае. Аналогично последовательности 1520 TS-пакетов, показанной на фиг. 15, последовательность TS-пакетов 1620 разделяется на три группы 1621, 1622 и 1623 в порядке с начала. Первая группа 1621 включает в себя PES-заголовок 1511, идентификационный код 1501 суб-AU, заголовок 1502 подпоследовательности и заголовок 1503 изображения. Вторая группа 1622 включает в себя дополнительные данные 1504, состоящие только из метаданных 1509 смещения. Третья группа 1613 включает в себя данные 1505 сжатых изображений, дополняющие данные 1506, код 1507 конца последовательности и код 1508 конца потока. Следует отметить, что дополнительные данные, отличные от метаданных смещения, если включены в VAU #1 1500, сохраняются в первой группе 1621 или третьей группе 1613. Области со штриховкой на фиг. 16 показывают дополнительные данные 1504, состоящие только из метаданных 1509 смещения, а пунктирные области показывают данные 1511, 1501-1503, размещаемые перед дополнительными данными в PES-пакете 1510. TS-заголовки 1631, 1641, 1651 TS-пакетов 1630, 1640, 1650, принадлежащих первой группе 1621 и второй группе 1622, указывают значение TS-приоритета, равное "1". С другой стороны, TS-заголовки 1661 TS-пакетов 1660, принадлежащих третьей группе 1623, указывают значение TS-приоритета, равное "0". Следует отметить, что эти значения могут задаваться в обратном порядке. Даже в этом случае, TS-пакеты, содержащие дополнительные данные 1504, состоящие только из метаданных 1509 смещения, имеют значение TS-приоритета, отличное от TS-пакетов, содержащих данные 1505 сжатых изображений. Соответственно, декодер системных целевых объектов в устройстве 102 воспроизведения может легко отделять группу TS-пакетов, содержащих дополнительные данные 1504, состоящие только из метаданных 1509 смещения, от группы TS-пакетов, содержащих данные 1505 сжатых изображений, посредством использования TS-приоритета.
[Информация переключения декодирования]
Фиг. 17A является принципиальной схемой, показывающей структуру данных информации 1750 переключения декодирования. Информация 1750 переключения декодирования включается в дополнительные данные в каждой VAU как в видеопотоке для воспроизведения базового вида, так и в видеопотоке для воспроизведения зависимого вида, показанном на фиг. 8. Тем не менее, в VAU #1 832, расположенной в начале каждого VOP в видеопотоке для воспроизведения зависимого вида, информация 1750 переключения декодирования сохраняется в дополнительных данных, которые отличаются от дополнительных данных 832D, содержащих метаданные смещения. Дополнительные данные 831D и 832D, в частности, в MPEG-4 AVC и MVC, соответствуют SEP, который является типом NAL-единицы. Информация 1750 переключения декодирования является информацией, чтобы инструктировать декодеру в устройстве 102 воспроизведения легко указывать следующую VAU, чтобы декодировать. Как описано ниже, декодер поочередно декодирует видеопоток для воспроизведения базового вида и видеопоток для воспроизведения зависимого вида в единицах VAU. При этом декодер, в общем, указывает следующую VAU, которая должна быть декодирована, в совмещении со временем, показанным посредством DTS, назначенной каждой VAU. Многие типы декодеров, тем не менее, продолжают декодировать VAU по порядку при игнорировании DTS. Для таких декодеров предпочтительно для каждой VAU включать в себя информацию 1750 переключения декодирования в дополнение к DTS.
Как показано на фиг. 17A, информация 1750 переключения декодирования включает в себя тип 1751 следующей единицы доступа, размер 1752 следующей единицы доступа и счетчик 1753 декодирования. Тип 1751 следующей единицы доступа указывает то, принадлежит следующая VAU, которая должна быть декодирована, видеопотоку для воспроизведения базового вида или видеопотоку для воспроизведения зависимого вида. Например, когда значение типа 1751 следующей единицы доступа равно "1", следующая VAU, которая должна быть декодирована, принадлежит видеопотоку для воспроизведения базового вида, а когда значение типа 1751 следующей единицы доступа равно "2", следующая VAU, которая должна быть декодирована, принадлежит видеопотоку для воспроизведения зависимого вида. Когда значение типа 1751 следующей единицы доступа равно "0", текущая VAU находится в конце потока, предназначенного для декодирования, и следующей VAU, которая должна быть декодирована, не существует. Размер 1752 следующей единицы доступа указывает размер следующей VAU, которая должна быть декодирована. Посредством обращения к размеру 1752 следующей единицы доступа декодер в устройстве 102 воспроизведения может указывать размер VAU без анализа ее фактической структуры. Соответственно, декодер может легко извлекать VAU из буфера. Счетчик 1753 декодирования показывает порядок декодирования VAU, которой он принадлежит. Порядок подсчитывается с VAU, которая включает в себя I-изображение в видеопотоке для воспроизведения базового вида.
Фиг. 17B является схематичным представлением, показывающим последовательности счетчиков 1710 и 1720 декодирования, выделенных каждому изображению в видеопотоке 1701 для воспроизведения базового вида и в видеопотоке 1702 для воспроизведения зависимого вида. Как показано на фиг. 17B, счетчики 1710 и 1720 декодирования увеличиваются поочередно между двумя видеопотоками 1701 и 1702. Например, для VAU 1711, которая включает в себя I-изображение в видеопотоке 1701 для воспроизведения базового вида, значение "1" назначается счетчику 1710 декодирования. Затем, значение "2" назначается счетчику 1720 декодирования для VAU 1721, которая включает в себя следующее P-изображение, которое должно быть декодировано в видеопотоке 1702 для воспроизведения зависимого вида. Кроме того, значение "3" назначается счетчику 1710 декодирования для VAU 1712, которая включает в себя следующее P-изображение, которое должно быть декодировано в видеопотоке 1701 для воспроизведения базового вида. Посредством такого назначения, даже когда декодер в устройстве 102 воспроизведения не может считывать одну из VAU вследствие некоторой ошибки, декодер может немедленно указывать пропущенное изображение с использованием счетчиков 1710 и 1720 декодирования. Соответственно, декодер может выполнять обработку ошибок надлежащим образом и быстро.
В примере, показанном на фиг. 17B, ошибка возникает в ходе считывания третьей VAU 1713 в видеопотоке 1701 для воспроизведения базового вида, и Br-изображение отсутствует. Во время декодирования P-изображения, содержащегося во второй VAU 1722 в видеопотоке 1702 для воспроизведения зависимого вида, тем не менее, декодер считывает счетчик 1720 декодирования для этой VAU 1722 и сохраняет значение. Соответственно, декодер может прогнозировать счетчик 1710 декодирования для следующей VAU, которая должна обрабатываться. В частности, счетчик 1720 декодирования в VAU 1722, которая включает в себя P-изображение, составляет "4". Следовательно, счетчик 1710 декодирования для следующей VAU, которая должна считываться, может быть прогнозирован как равный "5". Следующей VAU, которая фактически считывается, тем не менее, является четвертая VAU 1714 в видеопотоке 1701 для воспроизведения базового вида, счетчик 1710 декодирования которой равен "7". Декодер тем самым может обнаруживать, что он неудачно считывает VAU. Соответственно, декодер может выполнять следующую обработку: "пропускать обработку декодирования B-изображения, извлеченного из третьей VAU 1723 в видеопотоке 1702 для зависимого просмотра, поскольку Br-изображение, которое должно использоваться в качестве опорного, отсутствует". Таким образом, декодер проверяет счетчики 1710 и 1720 декодирования во время каждого процесса декодирования. Следовательно, декодер может быстро обнаруживать ошибки в ходе считывания VAU и может быстро выполнять соответствующую обработку ошибок. Как результат, декодер может препятствовать искажению воспроизводимого видео посредством шума.
Фиг. 17C является принципиальной схемой, показывающей другие примеры счетчиков 1730 и 1740 декодирования, выделяемых каждому изображению в видеопотоке 1701 для воспроизведения базового вида и видеопотоке 1702 для воспроизведения зависимого вида. Как показано на фиг. 12C, счетчики 1730 и 1740 декодирования увеличиваются отдельно в видеопотоках 1701 и 1702. Следовательно, счетчики 1730 и 1740 декодирования являются идентичными для пары изображений в идентичной трехмерной VAU. В этом случае, когда декодер декодирует VAU в видеопотоке 1701 для воспроизведения базового вида, он может прогнозировать, что "счетчик 1230 декодирования является идентичным счетчику 1740 декодирования для следующей VAU, которая должна быть декодирована в видеопотоке 1702 для воспроизведения зависимого вида". В отличие от этого, когда декодер декодирует VAU в видеопотоке 1702 для воспроизведения зависимого вида, он может прогнозировать, что "счетчик 1730 декодирования для следующей VAU, которая должна быть декодирована в видеопотоке 1701 для воспроизведения базового вида, является идентичным счетчику 1740 декодирования плюс один". Соответственно, в любой момент времени декодер может быстро обнаруживать ошибку в считывании VAU с использованием счетчиков 1730 и 1740 декодирования и может быстро выполнять соответствующую обработку ошибок. Как результат, декодер может препятствовать искажению воспроизводимого видео посредством шума.
<<Другие TS-пакеты, включенные в файл AV-потока>>
В дополнение к TS-пакетам, преобразованным из элементарного потока, как показано на фиг. 3, типы TS-пакетов, включенных в файл AV-потока, включают в себя таблицу ассоциаций программ (PAT), таблицу структуры программ (PMT) и временную отметку программ (PCR). PCR, PMT и PAT указываются посредством европейского стандарта цифровой широковещательной передачи и имеют намерение упорядочивать частичный транспортный поток, составляющий одну программу. Посредством использования PCR, PMT и PAT, файл AV-потока также может упорядочиваться способом, аналогичным частичному транспортному потоку. PAT показывает PID PMT, включенной в этот же файл AV-потока. PID самой PAT равен 0. PMT включает в себя PID для элементарных потоков, представляющих видео, аудио, субтитры и т.д., включенные в один файл AV-потока, а также информацию атрибутов для элементарных потоков. PMT также имеет различные дескрипторы, касающиеся AV-клипа. Дескрипторы, в частности, включают в себя информацию управления копированием, показывающую то, разрешено или нет копирование файла AV-потока. PCR включает в себя информацию, указывающую значение системного таймера (STC), которое должно быть ассоциировано с ATS, назначенной самой PCR. STC, упоминаемая здесь, является опорным синхросигналом, используемым в качестве опорного уровня для PTS и DTS посредством декодера в устройстве 102 воспроизведения. Этот декодер использует PCR, чтобы синхронизировать STC с ATC.
Фиг. 18 является схематичным представлением, показывающим структуру данных PMT 1810. PMT 1810 включает в себя PMT-заголовок 1801, дескрипторы 1802 и фрагменты информации 1803 потока. PMT-заголовок 1801 указывает длину данных и т.д., сохраненных в PMT 1810. Каждый дескриптор 1802 относится ко всему файлу AV-потока, который включает в себя PMT 1810. Информация управления копированием включается в один из дескрипторов 1802. Каждый фрагмент информации 1803 потока относится к одному из элементарных потоков, включенных в файл AV-потока, и назначается различному элементарному потоку. Каждый фрагмент информации 1803 потока включает в себя тип 1831 потока, PID 1832 и дескрипторы 1833 потока. Тип 1831 потока включает в себя идентификационную информацию для кодека, используемого для сжатия элементарного потока. PID 1832 указывает PID элементарного потока. Дескрипторы 1833 потока включают в себя информацию атрибутов элементарного потока, такую как частота кадров и соотношение сторон.
Посредством использования PCR, PMT и PAT, декодер в устройстве воспроизведения может быть задан так, чтобы обрабатывать файл AV-потока способом, аналогичным частичному транспортному потоку в европейском стандарте цифровой широковещательной передачи. Таким образом, можно обеспечивать совместимость между устройством воспроизведения для BD-ROM-диска 101 и терминалом, соответствующим европейскому стандарту цифровой широковещательной передачи.
<<Перемеженная компоновка мультиплексированных потоковых данных>>
Для плавного воспроизведения трехмерных видеоизображений физическая компоновка видеопотока для воспроизведения базового вида и видеопотока для воспроизведения зависимого вида на BD-ROM-диске 101 является важной. Это "плавное воспроизведение" означает воспроизведение видео и аудио из мультиплексированных потоковых данных без прерывания.
Фиг. 19 является схематичным представлением, показывающим физическую компоновку мультиплексированных потоковых данных на BD-ROM-диске 101. Как показано на фиг. 19, мультиплексированные потоковые данные разделяются на множество блоков D[n], B[n] данных (n=0, 1, 2, 3, ...) и размещаются на BD-ROM-диске 101. "Блок данных" упоминается как последовательность данных, записанных в непрерывной области на BD-ROM-диске 101, т.е. множество физически смежных секторов. Поскольку физические адреса и логические адреса на BD-ROM-диске 101 являются практически идентичными, LBN в рамках каждого блока данных также являются непрерывными. Соответственно, BD-ROM-накопитель 121 может непрерывно считывать блок данных без инструктирования оптической головке воспроизведения выполнять поиск дорожек. В дальнейшем в этом документе, блоки B[n] данных, принадлежащие основному TS, упоминаются как "блоки данных для воспроизведения базового вида", а блоки D[n] данных, принадлежащие суб-TS, упоминаются как "блоки данных для воспроизведения зависимого вида". В частности, блоки данных, которые включают в себя видеопоток для просмотра правым глазом, упоминаются как "блоки данных для просмотра правым глазом", а блоки данных, которые включают в себя поток карт глубины, упоминаются как "блоки данных карты глубины".
В файловой системе на BD-ROM-диске 101, к каждому блоку B[n] и D[n] данных может осуществляться доступ как к одному экстенту в файлах 2D или файлах DEP. Другими словами, логический адрес для каждого блока данных может быть известен из записи файла для файла 2D или файла DEP (подробности см. в разделе "<Дополнительное пояснение>").
В примере, показанном на фиг. 19, запись 1910 файла в файле 2D (01000.m2ts) 241 указывает размеры блоков B[n] данных для воспроизведения базового вида и LBN их начала. Соответственно, к блокам B[n] данных для воспроизведения базового вида может осуществляться доступ как к экстентам EXT2D[n] в файле 2D 241. В дальнейшем в этом документе, экстенты EXT2D[n], принадлежащие файлу 2D 241, упоминаются как "двумерные экстенты". С другой стороны, запись 1920 файла в файла DEP (02000.m2ts) 242 указывает размеры блоков D[n] данных для воспроизведения зависимого вида и LBN их начала. Соответственно, к каждому блоку D[n] данных для воспроизведения зависимого вида может осуществляться доступ как к экстенту EXT2[n] в файле DEP 242. В дальнейшем в этом документе, экстенты EXT2[n], принадлежащие файлу DEP 242, упоминаются как "экстенты для воспроизведения зависимого вида".
Как показано на фиг. 19, группа блоков данных записывается непрерывно вдоль дорожки на BD-ROM-диске 101. Кроме того, блоки B[n] данных для воспроизведения базового вида и блоки D[n] данных для воспроизведения зависимого вида размещаются поочередно один за другим. Этот тип компоновки группы блоков данных упоминается как "перемеженная компоновка". В частности, одна последовательность блоков данных, записанных в перемеженной компоновке, упоминается как "блок экстентов". Три блока 1901, 1902 и 1903 экстентов показаны на фиг. 19. Как показано в первых двух блоках 1901 и 1902 экстентов, область NAV хранения для данных, отличных от мультиплексированных потоковых данных, существует между блоками экстентов, тем самым разделяя блоки экстентов. Кроме того, когда BD-ROM-диск 101 является многоуровневым диском, т.е. когда BD-ROM-диск 101 включает в себя множество слоев для записи, блоки экстентов также могут разделяться межслойной границы LB между слоями для записи, как во втором и третьем блоках 1902 и 1903 экстентов, показанных на фиг. 19. Таким образом, одна последовательность мультиплексированных потоковых данных, в общем, компонуется так, чтобы разделяться на множество блоков экстентов. В этом случае, чтобы устройство 102 воспроизведения плавно воспроизводило видеоизображения из мультиплексированных потоковых данных, необходимо, чтобы видеоизображения воспроизводились из блоков экстентов, которые должны быть плавно соединены. В дальнейшем в этом документе, обработка, требуемая посредством устройства 102 воспроизведения для этой цели, упоминается как "плавное соединение между блоками экстентов".
Блоки 1901-1903 экстентов имеют идентичное число двух типов блоков D[n] и B[n] данных. Кроме того, ATC-время экстента является идентичным для пары D[n] и B[n] смежных блоков данных. В этом контексте "таймер поступления (ATC)" означает синхросигнал, который выступает в качестве стандарта для ATS. Кроме того, "ATC-время экстента" задается посредством значения ATC и представляет диапазон ATS, назначенного исходным пакетам в экстенте, т.е. интервал времени от ATS исходного пакета в начале экстента до ATS исходного пакета в начале следующего экстента. Другими словами, ATC-время экстента является идентичным времени, требуемому для того, чтобы передавать все исходные пакеты в экстенте из буфера считывания в устройстве 102 воспроизведения в декодер системных целевых объектов. "Буфер считывания" - это буферное запоминающее устройство в устройстве 102 воспроизведения, в котором блоки данных, считанные из BD-ROM-диска 101, временно сохраняются перед передачей в декодер системных целевых объектов. Подробности относительно буфера считывания предоставляются позднее. В примере, показанном на фиг. 19, поскольку три блока 1901-1903 экстентов соединяются вместе плавно, ATC-времена экстента являются идентичными для пар блоков D[n], B[n] данных (n=0, 1, 2, ...).
VAU, расположенные в начале смежных блоков D[n] и B[n] данных, принадлежат одной трехмерной VAU и, в частности, включают в себя первое изображение GOP, представляющей одно трехмерное видеоизображение. Например, блок D[n] данных для воспроизведения зависимого вида является блоком D[n] данных для просмотра правым глазом, начало каждого блока D[n] данных для просмотра правым глазом включает в себя P-изображение для видеопотока для просмотра правым глазом, а начало блока B[n] данных для воспроизведения базового вида включает в себя I-изображение для видеопотока для воспроизведения базового вида. P-изображение для видеопотока для просмотра правым глазом представляет вид для просмотра правым глазом, когда двумерное видеоизображение, представленное посредством I-изображения в видеопотоке для воспроизведения базового вида, используется в качестве вида для просмотра левым глазом. В частности, P-изображение, как показано на фиг. 7, сжимается с использованием I-изображения в качестве опорного изображения. Соответственно, устройство 102 воспроизведения в режиме трехмерного воспроизведения может начинать воспроизведение трехмерных видеоизображений от любой пары блоков D[n] и B[n] данных. Другими словами, обработка, которая требует произвольного доступа видеопотоков, такая как воспроизведение с прерываниями, возможна. Это также справедливо в случае, когда блок D[n] данных для воспроизведения зависимого вида является блоком данных карты глубины.
Кроме того, в перемеженной компоновке, в смежных парах блоков D[n] и B[n] данных, блоки D[n] данных для воспроизведения зависимого вида размещаются перед блоками B[n] данных для воспроизведения базового вида. Это обусловлено тем, что, в общем, объем данных меньше в блоке D[n] данных для воспроизведения зависимого вида, чем в блоке B[n] данных для воспроизведения базового вида, т.е. скорость передачи битов является более низкой. Например, изображение, включенное в n-й блок D[n] данных для просмотра правым глазом, сжимается с использованием изображения, включенного в n-й блок B[n] данных для воспроизведения базового вида, в качестве опорного изображения. Соответственно, размер SEXT2[n] блока D[n] данных для просмотра правым глазом, в общем, равен или меньше размера SEXT1[n] блока B[n] данных для воспроизведения базового вида: SEXT2[n]≤SEXT1[n]. С другой стороны, объем данных в расчете на пиксел в карте глубины, т.е. число битов значения глубины, в общем, меньше объема данных в расчете на пиксел изображения для воспроизведения базового вида, т.е. суммы числа битов значения координаты цветности и значения α. Кроме того, как показано на фиг. 3A и 3B, в отличие от суб-TS, основной TS включает в себя другие элементарные потоки, такие как поток первичного аудио, в дополнение к потоку первичного видео. Следовательно, размер блока данных карты глубины, SEXT3[n], в общем, меньше или равен размеру блока B[n] данных для воспроизведения базового вида, SEXT1[n]: SEXT2[n]≤SEXT1[n].
[Значимость деления мультиплексированных потоковых данных на блоки данных]
Чтобы воспроизводить трехмерные видеоизображения плавно из BD-ROM-диска 101, устройство 102 воспроизведения должно параллельно обрабатывать основной TS и суб-TS. Емкость буфера считывания, подходящая для использования в такой обработке, тем не менее, в общем, является ограниченной. В частности, предусмотрен предел на объем данных, который может непрерывно считываться в буфер считывания из BD-ROM-диска 101. Соответственно, устройство 102 воспроизведения должно считывать секции основного TS и суб-TS с идентичным ATC-временем экстента посредством деления секций.
Фиг. 20A является схематичным представлением, показывающим компоновку основного TS 2001 и суб-TS 2002, записанных отдельно и последовательно на BD-ROM-диске. Когда устройство 102 воспроизведения параллельно обрабатывает основной TS 2001 и суб-TS 2002, как показано посредством стрелок (1)-(4) на сплошных линиях на фиг. 20A, BD-ROM-накопитель 121 поочередно считывает секции основного TS 2001 и суб-TS 2002, которые имеют идентичное ATC-время экстента. В это время, как показано посредством стрелок в пунктирных линиях на фиг. 20A, во время обработки считывания BD-ROM-накопитель 121 должен осуществлять большое изменение области, которая должна считываться на BD-ROM-диске. Например, после того, как первая секция основного TS 2001, показанная посредством стрелки (1), считана, BD-ROM-накопитель 121 временно прекращает операцию считывания посредством оптической головки воспроизведения и увеличивает скорость вращения BD-ROM-диска. Таким образом, BD-ROM-накопитель 121 быстро перемещает сектор на BD-ROM-диске, в котором записана первая секция суб-TS 2002, показанная посредством стрелки (2), в позицию оптической головки воспроизведения. Эта операция для того, чтобы временно прекращать считывание посредством оптической головки воспроизведения, и, в то время, когда считывание прекращено, позиция оптической головки воспроизведения выше следующей области считывалась, называется "переходом". Пунктирные линии со стрелкой, показанные на фиг. 20A, указывают диапазон переходов, необходимых во время обработки считывания. В течение каждого периода перехода обработка считывания посредством оптической головки воспроизведения прекращается, и только декодирование посредством декодера продолжается. Поскольку переход является чрезмерным в примере, показанном на фиг. 20A, трудно инструктировать обработке считывания не отставать от декодирования. Как результат, трудно устойчиво поддерживать плавное воспроизведение.
Фиг. 20B является схематичным представлением, показывающим компоновку блоков B[0], B[1], B[2], ... данных для воспроизведения базового вида и блоков D[0], D[1], D[2], ... данных для воспроизведения зависимого вида, записанных поочередно на BD-ROM-диске 101 согласно варианту осуществления 1 настоящего изобретения. Как показано на фиг. 20B, основной TS и суб-TS разделяются на множество блоков данных и размещаются поочередно. В этом случае, во время воспроизведения трехмерных видеоизображений устройство 102 воспроизведения считывает блоки B[0], D[0], B[1], D[1], ... данных по порядку с начала, как показано посредством стрелок (1)-(4) на фиг. 20B. Посредством простого считывания этих блоков данных по порядку, устройство 102 воспроизведения может плавно считывать основной TS и суб-TS поочередно. В частности, поскольку переход не осуществляется во время обработки считывания, плавное воспроизведение трехмерных видеоизображений может устойчиво поддерживаться.
<<Значимость предоставления для смежных блоков данных с идентичным ATC-временем экстента>>
Фиг. 20C является схематичным представлением, показывающим пример ATC-времен экстента для группы D[n] блоков данных для воспроизведения зависимого вида и группы B[n] блоков данных для воспроизведения базового вида, записанных в перемеженной компоновке (n=0, 1, 2). Как показано на фиг. 20C, ATC-время экстента является идентичным в каждой паре для блока D[n] данных для воспроизведения зависимого вида и непосредственно последующего блока B[n] данных для воспроизведения базового вида. Например, ATC-время экстента равно одной секунде для каждого из D[0] и B[0] в паре первого блока данных. Соответственно, когда блоки D[0] и B[0] данных считываются посредством буфера считывания в устройстве 102 воспроизведения, все TS-пакеты в них отправляются из буфера считывания в декодер системных целевых объектов в одном односекундном интервале. Аналогично, поскольку ATC-время экстента равно 0,7 секундам для каждого из D[1] и B[1] в паре второго блока данных, все TS-пакеты в каждом блоке данных передаются из буфера считывания в декодер системных целевых объектов в 0,7-секундном интервале.
Фиг. 20D является схематичным представлением, показывающим другой пример ATC-времен экстента для группы D[n] блоков данных для воспроизведения зависимого вида и группы B[n] блоков данных для воспроизведения базового вида, записанных в перемеженной компоновке. Как показано на фиг. 20D, ATC-времена экстента во всех блоках D[n] и B[n] данных равны одной секунде. Соответственно, в одном односекундном интервале, в котором любые из блоков D[n] и B[n] данных считываются посредством буфера считывания в устройстве 102 воспроизведения, все TS-пакеты в каждом из этих блоков данных передаются из буфера считывания в декодер системных целевых объектов.
Как описано выше, скорость сжатия блоков данных для воспроизведения зависимого вида, в общем, превышает скорость сжатия блоков данных для воспроизведения базового вида. Соответственно, декодирование блоков данных для воспроизведения зависимого вида, в общем, медленнее декодирования блоков данных для воспроизведения базового вида. С другой стороны, когда ATC-времена экстента равны, блоки данных для воспроизведения зависимого вида имеют меньший объем данных, чем блоки данных для воспроизведения базового вида. Следовательно, когда ATC-времена экстента являются идентичными для смежных блоков данных, как на фиг. 20C и 20D, скорость, с которой данные, которые должны быть декодированы, предоставляются в декодер системных целевых объектов, может легко поддерживаться одинаковой со скоростью обработки посредством декодера. Другими словами, декодер системных целевых объектов упрощает синхронизацию между декодированием блоков данных для воспроизведения базового вида и декодированием блоков данных для воспроизведения зависимого вида, в частности, при воспроизведении с прерываниями.
[Значимость размещения блоков данных меньшего объема данных первыми]
При считывании блока данных, расположенного в начале или в позиции начала воспроизведения каждого блока экстентов, устройство 102 воспроизведения в режиме трехмерного воспроизведения сначала считывает весь блок данных в буфер считывания. Блок данных не передается в декодер системных целевых объектов в течение того периода. После окончания считывания блока данных устройство 102 воспроизведения передает блок данных в декодер системных целевых объектов параллельно со следующим блоком данных. Эта обработка называется "предварительной загрузкой".
Техническая значимость предварительной загрузки является следующей. Во-первых, в L/R-режиме, блоки данных для воспроизведения базового вида необходимы для декодирования блоков данных для воспроизведения зависимого вида. Следовательно, чтобы поддерживать минимально необходимую емкость буфера для сохранения декодированных данных до обработки вывода, предпочтительно одновременно предоставлять блоки данных в декодер системных целевых объектов, которые должны быть декодированы. С другой стороны, в режиме глубины, требуется обработка для того, чтобы формировать пару видеоплоскостей, представляющую параллактические изображения, из пары декодированного изображения для воспроизведения базового вида и декодированной карты глубины. Соответственно, чтобы поддерживать минимально необходимую емкость буфера для сохранения декодированных данных до этой обработки, предпочтительно предоставлять в декодер системных целевых объектов блоки данных для воспроизведения базового вида одновременно с блоками данных карты глубины, которые должны быть декодированы. Следовательно, предварительная загрузка приводит к считыванию заранее всего блока данных в начале блока экстентов или в позиции начала воспроизведения в буфер считывания. Это предоставляет возможность одновременной передачи блока данных и следующего блока данных из буфера считывания в декодер системных целевых объектов и декодирования. Кроме того, последующие пары блоков данных также могут быть одновременно декодированы посредством декодера системных целевых объектов.
При предварительной загрузке весь блок данных, который считывается первым, сохраняется в буфере считывания. Соответственно, буфер считывания требует, по меньшей мере, емкости, равной размеру блока данных. Чтобы поддерживать минимальной емкость буфера считывания, размер блока данных, который должен быть предварительно загружен, должен быть как можно меньше. Между тем, для воспроизведения с прерываниями и т.д. любая пара блоков данных может выбираться в качестве позиции начала воспроизведения. По этой причине, блок данных, имеющий наименьший объем данных, размещается первым в каждой паре блоков данных. Это предоставляет возможность поддержания минимальной емкости буфера считывания.
<<Перекрестное связывание файлов AV-потока с блоками данных>>
Для группы блоков данных, показанной на фиг. 19, файлы AV-потока перекрестно связываются следующим образом. Запись 1940 файла в файле SS (01000.ssif) 244A рассматривает каждый блок 1901-1903 экстентов как один экстент, указывая размер каждого и LBN их начала. Соответственно, к блокам 1901-1903 экстентов может осуществляться доступ как к экстентам EXTSS[0], EXTSS[1] и EXTSS[2] файла SS 244A. В дальнейшем в этом документе, экстенты EXTSS[0], EXTSS[1] и EXTSS[2], принадлежащие файлу SS 244A, называются "экстентами SS". Каждый из экстентов SS EXTSS[0], EXTSS[1] и EXTSS[2] совместно использует блоки B[n] данных для воспроизведения базового вида с файлом 2D 241 и совместно использует блоки D[n] данных для воспроизведения зависимого вида с файлом DEP 242.
<<Путь воспроизведения для группы блоков экстентов>>
Фиг. 21 является схематичным представлением, показывающим путь 2101 воспроизведения в режиме двумерного воспроизведения для группы 1901-1903 блоков экстентов. Устройство 102 воспроизведения в режиме двумерного воспроизведения воспроизводит файл 2D 241. Соответственно, как указано посредством пути 2101 воспроизведения в режиме двумерного воспроизведения, блоки B[n] данных для воспроизведения базового вида (n=0, 1, 2, ...) считываются по порядку из блоков 1901-1903 экстентов как двумерные экстенты EXT2D[0], EXT2D[1] и EXT2D[2]. В частности, сначала, первый блок B[0] данных для воспроизведения базового вида считывается с первого блока 1901 экстентов, затем считывание непосредственно последующего блока D[0] данных для воспроизведения зависимого вида пропускается посредством первого перехода J2D1. Затем, второй блок B[1] данных для воспроизведения базового вида считывается, и после этого считывание непосредственно последующих данных NAV и блока D[1] данных для воспроизведения зависимого вида пропускается посредством второго перехода JNAV. Затем, считывание блоков данных для воспроизведения базового вида и переходы повторяются аналогично во втором и последующих блоках 1902 и 1903 экстентов.
Переход JLY, осуществляемый между вторым блоком 1902 экстентов и третьим блоком 1903 экстентов, является длинным переходом через межслойную границу LB. "Длинный переход" является собирательным термином для переходов с длительным временем поиска дорожек и конкретно упоминается как расстояние перехода, которое превышает предварительно определенное пороговое значение. "Расстояние перехода" означает длину области на BD-ROM-диске 101, считывание которой пропускается в течение периода перехода. Расстояние перехода обычно выражается как число секторов соответствующей секции. Пороговое значение, используемое для того, чтобы задавать длинный переход, указывается, например, как 40000 секторов в стандарте BD-ROM. Это пороговое значение, тем не менее, зависит от типа BD-ROM-диска и характеристик обработки считывания BD-ROM-накопителя. Длинные переходы, в частности, включают в себя переходы к фокусу и переходы к дорожке. "Переход к фокусу" - это переход, вызываемый посредством переключения слоев для записи, и он включает в себя обработку, чтобы изменять расстояние фокуса оптической головки воспроизведения. "Переход к дорожке" включает в себя обработку, чтобы перемещать оптическую головку воспроизведения в радиальном направлении вдоль BD-ROM-диска 101.
Фиг. 21 дополнительно показывает путь 2102 воспроизведения в L/R-режиме для группы 1901-1903 блоков экстентов. Устройство 102 воспроизведения в L/R-режиме воспроизводит файл SS 244A. Соответственно, как указано посредством пути 2102 воспроизведения в L/R-режиме, блоки 1901-1903 экстентов считываются по порядку как экстенты SS EXTSS[0], EXTSS[1] и EXTSS[2]. В частности, блоки D[0], B[0], D[1] и B[1] данных сначала последовательно считываются с первого блока 1901 экстентов, затем считывание непосредственно последующих данных NAV пропускается посредством первого перехода JNAV. Затем, блоки D[2], ..., B[3] данных последовательно считываются из второго блока 1902 экстентов. Непосредственно после этого, длинный переход JLY осуществляется одновременно с переключением слоя для записи, и затем блоки D[4], B[4], ..., данных последовательно считываются из третьего блока 1903 экстентов.
При считывании блоков 1901-1903 экстентов как экстентов файла SS 244A, устройство 102 воспроизведения считывает первый LBN экстентов SS EXTSS[0], EXTSS[1], ..., и их размер из записи 1940 файла в файле SS 244A и затем выводит LBN и размеры в BD-ROM-накопитель 121. BD-ROM-накопитель 121 непрерывно считывает данные, имеющие входной размер, из входного LBN. При такой обработке управление BD-ROM-накопителем 121 проще, чем при обработке, чтобы считывать группы блоков данных как экстенты в первом файле DEP 242 и файле 2D 241, по следующим причинам (A) и (B): (A) устройство 102 воспроизведения может обращаться по порядку к экстентам с использованием записи файла в одном местоположении, и (B) поскольку общее число экстентов, которые должны считываться, сокращается практически наполовину, общее число пар LBN и размер, который должен выводиться в BD-ROM-накопитель 121, сокращается наполовину. Тем не менее, после того, как устройство 102 воспроизведения считывает трехмерные экстенты EXTSS[0], EXTSS[1], ..., оно должно разделять каждый из них на блок данных для просмотра правым глазом и блок данных для воспроизведения базового вида и выводить их в декодер. Файл информации о клипах используется для этой обработки разделения. Подробности предоставляются ниже.
Как показано на фиг. 19, при фактическом считывании блоков 1901-1903 экстентов, BD-ROM-накопитель 121 выполняет переход J0 через нуль секторов во время с начала блока данных до начала следующего блока данных. "Переход через нуль секторов" - это перемещение оптической головки воспроизведения между двумя последовательными блоками данных. В течение периода, в котором выполняется переход через нуль секторов (в дальнейшем называемым "периодом перехода через нуль секторов"), оптическая головка воспроизведения временно приостанавливает свою операцию считывания и ожидает. В этом смысле, переход через нуль секторов считается "переходом, в котором расстояние перехода равно 0 секторам". Длина периода перехода через нуль секторов, т.е. период времени перехода через нуль секторов, может включать в себя, в дополнение ко времени для сдвига позиции оптической головки воспроизведения через вращение BD-ROM-диска 101, дополнительные затраты, вызываемые посредством обработки коррекции ошибок. "Дополнительные затраты, вызываемые посредством обработки коррекции ошибок" означает избыточное время, вызываемое посредством выполнения обработки коррекции ошибок два раза с использованием ECC-блока, когда граница между ECC-блоками не совпадает с границей между двумя блоками данных. Целый ECC-блок необходим для обработки коррекции ошибок. Соответственно, когда два последовательных блока данных совместно используют один ECC-блок, весь ECC-блок считывается и используется для обработки коррекции ошибок в ходе считывания любого блока данных. Как результат, каждый раз, когда один из этих блоков данных считывается, максимум 32 сектора избыточных данных дополнительно считывается. Дополнительные затраты, вызываемые посредством обработки коррекции ошибок, оцениваются как полное время для считывания избыточных данных, т.е. 32 сектора×2048 байтов×8 битов/байтов×2 экземпляра/скорость считывания. Следует отметить, что посредством конфигурирования каждого блока данных в единицах ECC-блоков, дополнительные затраты, вызываемые посредством обработки коррекции ошибок, могут исключаться из времени перехода через нуль секторов.
<<Файл информации о клипах>>
Фиг. 22 является схематичным представлением, показывающим структуру данных первого файла информации о клипах (01000.clpi), т.е. файла 231 информации о двумерных клипах. Файл 232 информации о клипах для воспроизведения зависимого вида (02000.clpi) и файл 233 информации о клипах (03000.clpi) имеют идентичную структуру данных. Далее сначала описывается структура данных, общая для всех файлов информации о клипах, с использованием структуры данных файла 231 информации о двумерных клипах в качестве примера. Впоследствии, различия в структуре данных между файлом информации о двумерных клипах и файлом информации о клипах для воспроизведения зависимого вида описываются.
Как показано на фиг. 22, файл 231 информации о двумерных клипах включает в себя информацию 2210 о клипах, информацию 2220 атрибутов потока, карту 2230 вхождений и трехмерные метаданные 2240. Трехмерные метаданные 2240 включают в себя начальные точки 2242 экстентов.
Информация 2210 о клипах включает в себя системную скорость 2211, время 2212 начала воспроизведения и время 2213 окончания воспроизведения. Системная скорость 2211 указывает системную скорость для файла 2D (01000.m2ts) 241. Устройство 102 воспроизведения в режиме двумерного воспроизведения передает TS-пакеты, принадлежащие файлу 2D 241, из буфера считывания в декодер системных целевых объектов. "Системная скорость" упоминается как верхний предел скорости передачи. Интервал между ATS исходных пакетов в файле 2D 241 задается так, что скорость передачи ограничена системной скоростью или меньшей скоростью. Время 2212 начала воспроизведения указывает PTS VAU, расположенной в начале файла 2D 241, к примеру, PTS первого видеокадра. Время 2212 окончания воспроизведения указывает то, что значение STC задержано на предварительно определенное время от PTS VAU, расположенной в конце файла 2D 241, к примеру, сумма PTS последнего видеокадра и времени воспроизведения одного кадра.
Информация 2220 атрибутов потока является таблицей соответствия между PID 2221 для каждого элементарного потока, включенного в файл 2D 241, и фрагментами информации 2222 атрибутов. Каждый фрагмент информации 2222 атрибутов является различным для видеопотока, аудиопотока, PG-потока и IG-потока. Например, информация атрибутов, соответствующая PID 0x1011 для потока первичного видео, включает в себя тип кодека, используемый для сжатия видеопотока, а также разрешение, соотношение сторон и частоту кадров для каждого изображения, составляющего видеопоток. С другой стороны, информация атрибутов, соответствующая PID 0x1100 для потока первичного аудио, включает в себя тип кодека, используемый для сжатия аудиопотока, число каналов, включенное в аудиопоток, язык и частоту дискретизации. Устройство 102 воспроизведения использует эту информацию 2222 атрибутов, чтобы инициализировать декодер.
[Карта вхождений]
Фиг. 23A является схематичным представлением, показывающим структуру данных карты 2230 вхождений. Как показано на фиг. 23A, карта 2230 вхождений включает в себя таблицы 2300. Предусмотрено такое же число таблиц 2300, сколько предусмотрено видеопотоков, мультиплексированных в основном TS, и таблицы назначаются одна за другой каждому видеопотоку. На фиг. 23A, каждая таблица 2300 отличается посредством PID видеопотока, которому она назначается. Каждая таблица 2300 включает в себя заголовок 2301 карты вхождений и точку 2302 входа. Заголовок 2301 карты вхождений включает в себя PID, соответствующий таблице 2300, и общее число точек 2302 входа, включенных в таблицу 2300. Точка 2302 входа ассоциирует каждую пару из PTS 2303 и номера 2304 исходного пакета (SPN) с идентификатором 2305 одной из отдельно отличающихся точек входа (EP_ID). PTS 2303 является эквивалентной PTS для одного из I-изображений, включенных в видеопоток для PID, указанного посредством заголовка 2301 карты вхождений. SPN 2304 является эквивалентным SPN для начала группы исходных пакетов, сохраненной в соответствующем I-изображении. "SPN" означает порядковый номер, назначенный последовательно с начала группе исходных пакетов, принадлежащей одному файлу AV-потока. SPN используется как адрес для каждого исходного пакета в файле AV-потока. В карте 2230 вхождений в файле 231 информации о двумерных клипах, SPN означает номер, назначенный группе исходных пакетов, принадлежащей файлу 2D 241, т.е. группе исходных пакетов, составляющей основной TS. Соответственно, точка 2302 входа выражает соответствие между PTS и адресом, т.е. SPN, каждого I-изображения, включенного в файл 2D 241.
Точка 2302 входа не должна задаваться для всех I-изображений в файле 2D 241. Тем не менее, когда I-изображение находится в начале GOP, и TS-пакет, который включает в себя начало этого I-изображения, находится в начале двумерного экстента, точка 2302 входа должна задаваться для этого I-изображения.
Фиг. 23B является схематичным представлением, показывающим исходные пакеты в группе 2310 исходных пакетов, принадлежащей файлу 2D 241, которые ассоциированы с каждым EP_ID 2305 посредством карты 2230 вхождений. Фиг. 23C является схематичным представлением, показывающим группу D[n], B[n] блоков данных (n=0, 1, 2, 3, ...) на BD-ROM-диске 101, соответствующую группе 2310 исходных пакетов. Когда устройство 102 воспроизведения воспроизводит двумерные видеоизображения из файла 2D 241, оно обращается к карте 2230 вхождений, чтобы указывать SPN для исходного пакета, который включает в себя кадр, представляющий случайную сцену, из PTS для этого кадра. В частности, когда, например, PTS=360000 указывается в качестве PTS для конкретной точки входа для позиции начала воспроизведения, устройство 102 воспроизведения сначала извлекает SPN=3200, выделенный этой PTS в карте 2230 вхождений. Затем, устройство 102 воспроизведения находит частное SPN×192/2048, т.е. значение SPN, умноженное на 192 байта, объем данных в расчете на исходный пакет, и разделенное на 2048 байтов, объем данных в расчете на сектор. Как можно понять из фиг. 5B и 5C, это значение является идентичным общему числу секторов, записанных в основной TS до исходного пакета, которому назначается SPN. В примере, показанном на фиг. 23B, это значение равно 3200×192/2048=300 и равно общему числу секторов, в которые группы исходных пакетов 2311 записываются, от SPN 0 до 3199. Затем, устройство 102 воспроизведения обращается к записи файла в файле 2D 241 и указывает LBN (общее число+1)-вого сектора при подсчете с начала для групп секторов, в которые записываются группы двумерных экстентов. В примере, показанном на фиг. 23C, в рамках групп секторов, в которые записаны блоки B[0], B[1], ..., B[2], ... данных для воспроизведения базового вида, к которым может осуществляться доступ как к двумерным экстентам EXT2D[0], EXT2D[1], EXT2D[2], LBN 301-ого сектора при подсчете с начала указывается. Устройство 102 воспроизведения указывает этот LBN в BD-ROM-накопитель 121. Таким образом, группы блоков данных для воспроизведения базового вида считываются как совмещенные единицы по порядку из сектора для этого LBN. Кроме того, из первой совмещенной единицы, которая считывается, устройство 102 воспроизведения выбирает исходный пакет, указанный посредством точки входа для позиции начала воспроизведения, и декодирует I-изображение. Далее последующие изображения декодируются по порядку со ссылкой на уже декодированные изображения. Таким образом, устройство 102 воспроизведения может воспроизводить двумерные видеоизображения из файла 2D 241 от указанного PTS вперед.
Кроме того, карта 2230 вхождений является полезной для эффективной обработки во время быстрого воспроизведения мультимедиа, к примеру, ускоренной перемотки вперед, назад и т.д. Например, устройство 102 воспроизведения в режиме двумерного воспроизведения сначала обращается к карте 2230 вхождений, чтобы считывать SPN с началом в позиции начала воспроизведения, к примеру, считывать SPN=3200, 4800, ..., по порядку от точек входа EP_ID=2, 3, ..., которые включают в себя PTS с началом в PTS=360000. Затем, устройство 102 воспроизведения обращается к записи файла в файле 2D 241, чтобы указывать LBN секторов, соответствующих каждому SPN. Устройство 102 воспроизведения затем указывает каждый LBN в BD-ROM-накопитель 121. Совмещенные единицы тем самым считываются из сектора для каждого LBN. Кроме того, из каждой совмещенной единицы устройство 102 воспроизведения выбирает исходный пакет, указанный посредством каждой точки входа, и затем извлекает и декодирует I-изображение. Устройство 102 воспроизведения тем самым может избирательно воспроизводить I-изображение из файла 2D 241 без анализа самой группы двумерных экстентов EXT2D[n].
[Начальная точка экстента]
Фиг. 24A является схематичным представлением, показывающим структуру данных начальных точек 2242 экстентов. Как показано на фиг. 24A, "начальная точка экстента" 2242 включает в себя идентификаторы 2411 экстента для воспроизведения базового вида (EXT1_ID) и SPN 2412. EXT1_ID 2411 являются порядковыми номерами, назначенными последовательно с начала блокам данных для воспроизведения базового вида, принадлежащим файлу SS (01000.ssif) 244A. Один SPN 2412 назначается каждому EXT1_ID 2411 и является идентичным SPN для исходного пакета, расположенного в начале блока данных для воспроизведения базового вида, идентифицированного посредством EXT1_ID 2411. Этот SPN является порядковым номером, назначенным с начала исходным пакетам, включенным в группу блоков данных для воспроизведения базового вида, принадлежащую файлу SS 244A.
В блоках 1901-1903 экстентов, показанных на фиг. 19, файл 2D 241 и файл SS 244A совместно используют блоки B[0], B[1], B[2], ..., данных для воспроизведения базового вида совместно. Тем не менее, группы блоков данных, размещенные в местоположениях, требующих длинного перехода, к примеру, на границах между слоями для записи, в общем, включают в себя блоки данных для воспроизведения базового вида, принадлежащие только одному из файла 2D 241 или файла SS 244A (подробности см. в разделе <<Дополнительное пояснение>>). Соответственно, SPN 2412, который указывает начальную точку 2242 экстента, в общем, отличается от SPN для исходного пакета, расположенного в начале двумерного экстента, принадлежащего файлу 2D 241.
Фиг. 24B является схематичным представлением, показывающим структуру данных начальных точек 2420 экстентов, включенных во второй файл информации о клипах (02000.clpi), т.е. файл 232 информации о клипах для воспроизведения зависимого вида. Как показано на фиг. 24B, начальная точка 2420 экстента включает в себя идентификаторы 2421 экстентов для воспроизведения зависимого вида (EXT2_ID) и SPN 2422. EXT2_ID 2421 являются порядковыми номерами, назначенными с начала блокам данных для воспроизведения зависимого вида, принадлежащим файлу SS 244A. Один SPN 2422 назначается каждому EXT2_ID 2421 и является идентичным SPN для исходного пакета, расположенного в начале блока данных для воспроизведения зависимого вида, идентифицированного посредством EXT2_ID 2421. Этот SPN является порядковым номером, назначенным по порядку с начала исходным пакетам, включенным в группу блоков данных для воспроизведения зависимого вида, принадлежащую файлу SS 244A.
Фиг. 24D является схематичным представлением, представляющим соответствие между экстентами EXT2[0], EXT2[1], ..., для воспроизведения зависимого вида, принадлежащими файлу DEP (02000.m2ts) 242, и SPN 2422, показанными посредством начальных точек 2420 экстентов. Как показано на фиг. 19, файл DEP 242 и файл SS 244A совместно используют блоки данных для воспроизведения зависимого вида совокупно. Соответственно, как показано на фиг. 24D, каждый SPN 2422, показанный посредством начальных точек 2420 экстентов, является идентичным SPN для исходного пакета, расположенного в начале каждого экстента EXT2[0], EXT2[1] для воспроизведения зависимого вида.
Как описано ниже, начальная точка 2242 экстента в файле 231 информации о двумерных клипах и начальная точка 2220 экстента в файле 232 информации о клипах для воспроизведения зависимого вида используются для того, чтобы обнаруживать границу блоков данных, включенных в каждый экстент SS в ходе воспроизведения трехмерных видеоизображений из файла SS 244A.
Фиг. 24E является схематичным представлением, показывающим пример соответствия между экстентом SS EXTSS[0], принадлежащим файлу SS 244A, и блоком экстентов на BD-ROM-диске 101. Как показано на фиг. 24E, блок экстентов включает в себя группы D[n] и B[n] блоков данных (n=0, 1, 2, ...) в перемеженной компоновке. Следует отметить, что последующее описание также является применимым для других компоновок. К блоку экстентов может осуществляться доступ как к одному экстенту SS EXTSS[0]. Кроме того, в экстенте SS EXTSS[0], число исходных пакетов, включенных в блок B[n] данных для воспроизведения базового вида, в начальной точке 2242 экстента равно разности A(n+1)-An между SPN, соответствующими EXT1_ID=n+1 и n. В этом случае, A0=0. С другой стороны, число исходных пакетов, включенных в блок D[n+1] данных для воспроизведения зависимого вида, в начальной точке экстента 2420 равно разности B(n+1)-Bn между SPN, соответствующими EXT2_ID=n+1 и n. В этом случае, B0=0.
Когда устройство 102 воспроизведения в режиме трехмерного воспроизведения воспроизводит трехмерные видеоизображения из файла SS 244A, устройство 102 воспроизведения обращается к картам вхождений и начальным точкам 2242 и 2420 экстентов, соответственно, обнаруженным в файлах 231 и 232 информации о клипах. При выполнении этого устройство 102 воспроизведения указывает, из PTS для кадра, представляющего вид для просмотра правым глазом случайной сцены, LBN для сектора, в котором записывается блок данных для воспроизведения зависимого вида, который требуется как компонент кадра. В частности, устройство 102 воспроизведения, например, сначала извлекает SPN, ассоциированный с PTS, из карты вхождений в файле 232 информации о клипах для воспроизведения зависимого вида. Допускается, что исходный пакет, указанный посредством SPN, включается в третий экстент EXT2[2] для воспроизведения зависимого вида в первом файле DEP 242, т.е. в блок D[2] данных для воспроизведения зависимого вида. Затем, устройство 102 воспроизведения извлекает "B2", наибольший SPN перед целевым SPN, из SPN 2422, показанных посредством начальных точек 2420 экстентов в файле 232 информации о клипах для воспроизведения зависимого вида. Устройство 102 воспроизведения также извлекает соответствующий EXT2_ID "2". Затем устройство 102 воспроизведения извлекает значение "A2" для SPN 2412, соответствующего EXT1_ID, который является идентичным EXT2_ID "2", из начальных точек 2242 экстентов в файле 231 информации о двумерных клипах. Устройство 102 воспроизведения дополнительно находит сумму B2+A2 извлеченных SPN. Как можно видеть из фиг. 24E, эта сумма B2+A2 является идентичной общему числу исходных пакетов, включенных в блоки данных, расположенные перед третьим блоком D[2] данных для воспроизведения зависимого вида, из блоков данных, включенных в экстент SS EXTSS[0]. Соответственно, эта сумма B2+A2, умноженная на 192 байта, объем данных в расчете на исходный пакет, и деленная на 2048 байтов, объем данных в расчете на сектор, т.е. (B2+A2)×192/2048, является идентичной числу секторов с начала экстента SS EXTSS[0] до элемента непосредственно перед третьим блоком D[2] данных для воспроизведения зависимого вида. С использованием этого частного, LBN для сектора, в котором записывается начало блока D[2] данных для воспроизведения зависимого вида, может указываться посредством обращения к записи файла для файла SS 244A.
После указания LBN через вышеописанную процедуру устройство 102 воспроизведения указывает LBN в BD-ROM-накопитель 121. Таким образом, часть экстента SS EXTSS[0], записанная с начала сектора для этого LBN, т.е. группа D[2], B[2], D[3], B[3], ..., блоков данных с началом в третьем блоке D[2] данных для воспроизведения зависимого вида, считывается как совмещенные единицы.
Устройство 102 воспроизведения дополнительно обращается к начальным точкам 2242 и 2420 экстентов, чтобы извлекать блоки данных для воспроизведения зависимого вида и блоки данных для воспроизведения базового вида поочередно из считанных экстентов SS. Например, допустим, что группа D[n], B[n] блоков данных (n=0, 1, 2, ...) считывается по порядку из экстента SS EXTSS[0], показанного на фиг. 24E. Устройство 102 воспроизведения сначала извлекает B1 исходных пакетов с начала экстента SS EXTSS[0] как блок D[0] данных для воспроизведения зависимого вида. Затем, устройство 102 воспроизведения извлекает B1-вый исходный пакет и последующие (A1-1) исходных пакетов, всего A1 исходных пакетов, как первый блок B[0] данных для воспроизведения базового вида. Устройство 102 воспроизведения затем извлекает (B1+A1)-вый исходный пакет и последующие (B2-B1-1) исходных пакетов, всего (B2-B1) исходных пакетов, как второй блок D[1] данных для воспроизведения зависимого вида. Устройство 102 воспроизведения дополнительно извлекает (A1+B2)-вый исходный пакет и последующие (A2-A1-1) исходных пакетов, всего (A2-A1) исходных пакетов, как второй блок B[1] данных для воспроизведения базового вида. После этого, устройство 102 воспроизведения тем самым продолжает обнаруживать границу между блоками данных в экстенте SS на основе числа считанных исходных пакетов, тем самым поочередно извлекая блоки данных для воспроизведения зависимого вида и для воспроизведения базового вида. Извлеченные блоки данных для воспроизведения базового вида и для воспроизведения зависимого вида передаются в декодер системных целевых объектов, чтобы декодироваться параллельно.
Таким образом, устройство 102 воспроизведения в режиме трехмерного воспроизведения может воспроизводить трехмерные видеоизображения из файла SS 244A с началом в конкретной PTS. Как результат, устройство 102 воспроизведения может фактически извлекать выгоду из вышеописанных преимуществ (A) и (B), касающихся управления BD-ROM-накопителем 121.
<<Файл base>>
Фиг. 24C является схематичным представлением, представляющим блоки B[0], B[1], B[2], ..., данных для воспроизведения базового вида, извлеченные из файла SS 244A посредством устройства 102 воспроизведения в режиме трехмерного воспроизведения. Как показано на фиг. 24C, при выделении SPN по порядку с начала группе исходных пакетов, включенной в блок B[n] данных для воспроизведения базового вида (n=0, 1, 2, ...), SPN исходного пакета, расположенного в начале блока B[n] данных, равен SPN 2412, указывающему начальную точку 2242 экстента. Группа блоков данных для воспроизведения базового вида, извлеченная из одного файла SS посредством обращения к начальным точкам экстентов, аналогично группе B[n] блоков данных для воспроизведения базового вида, упоминается как "файл base". Кроме того, блоки данных для воспроизведения базового вида, включенные в файл base, называются "экстентами для воспроизведения базового вида". Как показано на фиг. 24E, к каждому экстенту EXT1[0], EXT1[1], ..., для воспроизведения базового вида обращается начальная точка 2242 или 2420 экстента в файле информации о клипах.
Экстент EXT1[n] для воспроизведения базового вида совместно использует один блок B[n] данных для воспроизведения базового вида с двумерным экстентом EXT2D[n]. Соответственно, файл base включает в себя основной TS, идентичный основному TS файла 2D. В отличие от двумерного экстента EXT2D[n], тем не менее, к экстенту EXT1[n] для воспроизведения базового вида не обращается ни одна запись файла. Как описано выше, экстент EXT1[n] для воспроизведения базового вида извлекается из экстента SS EXTSS[·] в файле SS с использованием начальной точки экстента в файле информации о клипах. Файл base тем самым отличается от традиционного файла вследствие невключения записи файла и вследствие необходимости начальной точки экстента в качестве опорного уровня для экстента для воспроизведения базового вида. В этом смысле, файл base является "виртуальным файлом". В частности, файл base не распознается посредством файловой системы и не отображается в структуре каталогов/файлов, показанной на фиг. 2.
Фиг. 25 является схематичным представлением, показывающим соответствие между одним блоком 2500 экстентов, записанным на BD-ROM-диске 101, и каждой из групп блоков экстентов в файле 2D 2510, файле base 2511, файле DEP 2512 и файле SS 2520. Как показано на фиг. 25, блок 2500 экстентов включает в себя блоки D[n] данных для воспроизведения зависимого вида и блоки B[n] данных для воспроизведения базового вида (n=..., 0, 1, 2, 3, ...). Блок B[n] данных для воспроизведения базового вида принадлежит файлу 2D 2510 как двумерный экстент EXT2D[n]. Блок D[n] данных для воспроизведения зависимого вида принадлежит файлу DEP 2512 как экстент EXT2[n] для воспроизведения зависимого вида. Весь блок 2500 экстентов принадлежит файлу SS 2520 как один экстент SS EXTSS[0]. Соответственно, экстент SS EXTSS[0] совместно использует блок B[n] данных для воспроизведения базового вида с двумерным экстентом EXT2D[n] и совместно использует блок D[n] данных для воспроизведения зависимого вида с экстентом EXT2[n] для воспроизведения зависимого вида. После считывания в устройство 102 воспроизведения, экстент SS EXTSS[0] разделяется на блок D[n] данных для воспроизведения зависимого вида и блок B[n] данных для воспроизведения базового вида. Эти блоки B[n] данных для воспроизведения базового вида принадлежат файлу base 2511 как экстенты EXT1[n] для воспроизведения базового вида. Граница в экстенте SS EXTSS[0] между экстентом EXT1[n] для воспроизведения базового вида и экстентом EXT2[n] для воспроизведения зависимого вида указывается с использованием начальной точки экстента в файле информации о клипах, соответствующем каждому из файла 2D 2510 и файла DEP 2512.
<<Файл информации о клипах для воспроизведения зависимого вида>>
Файл информации о клипах для воспроизведения зависимого вида имеет структуру данных, идентичную структуре данных файла информации о двумерных клипах, показанного на фиг. 22-24. Соответственно, последующее описание охватывает различия между файлом информации о клипах для воспроизведения зависимого вида и файлом информации о двумерных клипах. Подробности относительно общих черт могут быть обнаружены в вышеприведенном описании.
Файл информации о клипах для воспроизведения зависимого вида отличается от файла информации о двумерных клипах главным образом в следующих двух аспектах: (i) условия задаются для информации атрибутов потока и (ii) условия задаются для точек входа.
(i) Когда видеопоток для воспроизведения базового вида и видеопоток для воспроизведения зависимого вида должны использоваться для воспроизведения трехмерных видеоизображений посредством устройства 102 воспроизведения в L/R-режиме, как показано на фиг. 7, видеопоток для воспроизведения зависимого вида сжимается с использованием видеопотока для воспроизведения базового вида. Здесь, атрибуты видеопотока для видеопотока для воспроизведения зависимого вида становятся эквивалентными видеопотоку для воспроизведения базового вида. Информация атрибутов видеопотока для видеопотока для воспроизведения базового вида ассоциирована с PID=0x1011 в информации 2220 атрибутов потока в файле информации о двумерных клипах. С другой стороны, информация атрибутов видеопотока для видеопотока для воспроизведения зависимого вида ассоциирована с PID=0x1012 или 0x1013 в информации атрибутов потока в файле информации о клипах для воспроизведения зависимого вида. Соответственно, элементы, показанные на фиг. 22, т.е. кодек, разрешение, соотношение сторон и частота кадров, должны совпадать между двумя фрагментами информации атрибутов видеопотока. Если тип кодека совпадает, то опорная взаимосвязь между изображениями в видеопотоке для воспроизведения базового вида и в видеопотоке для воспроизведения зависимого вида устанавливается во время кодирования, и тем самым каждое изображение может быть декодировано. Если разрешение, соотношение сторон и частота кадров совпадают, то экранное отображение левого и правого видео может синхронизироваться. Следовательно, эти видео могут показываться как трехмерные видеоизображения без возникновения чувства некомфортности у зрителей.
(ii) Карта вхождений в файле информации о клипах для воспроизведения зависимого вида включает в себя таблицу, выделенную видеопотоку для воспроизведения зависимого вида. Аналогично таблице 2300, показанной на фиг. 23A, эта таблица включает в себя заголовок карты вхождений и точки входа. Заголовок карты вхождений указывает PID для видеопотока для воспроизведения зависимого вида, выделенного таблице, т.е. либо 0x1012, либо 0x1013. В каждой точке входа пара из PTS и SPN ассоциирована с одним EP_ID. PTS для каждой точки входа является идентичной PTS для первого изображения в одной из GOP, включенных в видеопоток для воспроизведения зависимого вида. SPN для каждой точки входа является идентичным первому SPN группы исходных пакетов, сохраненной в изображении, указанном посредством PTS, принадлежащей идентичной точке входа. Этот SPN означает порядковый номер, назначенный последовательно с начала группе исходных пакетов, принадлежащей файлу DEP, т.е. группе исходных пакетов, составляющей суб-TS. PTS для каждой точки входа должна совпадать с PTS, в рамках карты вхождений в файле информации о двумерных клипах, для точки входа в таблице, выделенной видеопотоку для воспроизведения базового вида. Другими словами, каждый раз, когда точка входа задается на начало группы исходных пакетов, которая включает в себя одно из набора изображений, включенных в идентичную трехмерную VAU, точка входа всегда должна задаваться на начало группы исходных пакетов, которая включает в себя другое изображение.
Фиг. 26 является схематичным представлением, показывающим пример точек входа, заданных в видеопотоке 2610 для воспроизведения базового вида и в видеопотоке 2620 для воспроизведения зависимого вида. В двух видеопотоках 2610 и 2620, GOP, которые имеют идентичный номер с начала, представляют видео в течение идентичного периода воспроизведения. Как показано на фиг. 26, в видеопотоке 2610 для воспроизведения базового вида, точки 2601B, 2603B и 2605B входа задаются на начало GOP с нечетным номером при подсчете с начала, т.е. GOP #1, GOP #3 и GOP #5. Соответственно, в видеопотоке 2620 для воспроизведения зависимого вида, также, точки 2601D, 2603D и 2605D входа задаются на начало GOP с нечетным номером при подсчете с начала, т.е. GOP #1, GOP #3 и GOP #5. В этом случае, когда устройство 102 воспроизведения начинает воспроизведение трехмерных видеоизображений с GOP #3, например, оно может сразу вычислять адрес позиции начала воспроизведения в файле SS, из SPN соответствующих точек 2603B и 2603D входа. В частности, когда обе точки 2603B и 2603D входа задаются на начало блока данных, то, как можно понять из фиг. 24E, сумма SPN точек 2603B и 2603D входа равна SPN позиции начала воспроизведения в рамках файла SS. Как описано со ссылкой на фиг. 33E, из этого числа исходных пакетов можно вычислять LBN сектора, в который записывается часть файла SS для позиции начала воспроизведения. Таким образом, даже во время воспроизведения трехмерных видеоизображений можно повышать скорость реакции для обработки, которая требует произвольного доступа к видеопотоку, такой как воспроизведение с прерываниями и т.п.
<Файл списков для двумерного воспроизведения>
Фиг. 27 является схематичным представлением, показывающим структуру данных файла списков для двумерного воспроизведения.
Первый файл 221 списков воспроизведения (00001.mpls), показанный на фиг. 2, имеет эту структуру данных. Как показано на фиг. 27, файл 221 списков для двумерного воспроизведения включает в себя основной путь 2701 и два подпути 2702 и 2703. Основной путь 2701 является последовательностью фрагментов информации элемента воспроизведения (PI), которая задает основной путь воспроизведения для файла 2D 241, т.е. секцию для воспроизведения и порядок воспроизведения секции. Каждый PI идентифицируется с помощью уникального идентификатора элемента воспроизведения ID #N (N=1, 2, 3, ...). Каждый PI #N задает различную секцию воспроизведения вдоль основного пути воспроизведения с помощью пары из PTS. Одна из PTS в паре представляет начальное время (входное время) секции воспроизведения, и другая представляет конечное время (выходное время). Кроме того, порядок PI в основном пути 2701 представляет порядок соответствующих секций воспроизведения в пути воспроизведения.
Каждый из подпутей 2702 и 2703 является последовательностью фрагментов информации субэлемента воспроизведения (SUB_PI), которая задает путь воспроизведения, который может ассоциироваться параллельно с основным путем воспроизведения для файла 2D 241. Такой путь воспроизведения является секцией файла 2D 241, отличающейся от представленной посредством основного пути 2701, или является секцией потоковых данных, мультиплексированных в другом файле 2D, наряду с соответствующим порядком воспроизведения. Путь воспроизведения также может указывать потоковые данные, мультиплексированные в файле 2D, отличном от файла 2D 241, в качестве секции для воспроизведения, наряду с соответствующим порядком воспроизведения. Потоковые данные, указанные посредством пути воспроизведения, представляют другие двумерные видеоизображения, которые должны воспроизводиться одновременно с двумерными видеоизображениями, воспроизводимыми из файла 2D 241 в соответствии с основным путем 2701. Эти другие двумерные видеоизображения включают в себя, например, подвидео в формате "картинка-в-картинке", окно обозревателя, всплывающее меню или субтитры. Порядковые номера "0" и "1" назначаются подпутям 2702 и 2703 в порядке регистрации в файле 221 списков для двумерного воспроизведения. Эти порядковые номера используются в качестве идентификаторов подпутей, чтобы идентифицировать подпути 2702 и 2703. В подпутях 2702 и 2703, каждый SUB_PI идентифицируется посредством уникального идентификатора субэлемента воспроизведения=#M (M=1, 2, 3, ...). Каждый SUB_PI #M задает различную секцию воспроизведения вдоль пути воспроизведения с помощью пары из PTS. Одна из PTS в паре представляет время начала воспроизведения секции воспроизведения, и другая представляет время окончания воспроизведения. Кроме того, порядок SUB_PI в подпутях 2702 и 2703 представляет порядок соответствующих секций воспроизведения в пути воспроизведения.
Фиг. 28 является схематичным представлением, показывающим структуру данных PI #N. Как показано на фиг. 28, PI #N включает в себя фрагмент ссылочной информации 2801 о клипах, время (In_Time) 2802 начала воспроизведения, время 2803 окончания воспроизведения (Out_Time), условие 2804 соединения и таблицу 2805 выбора потока (в дальнейшем называемую "STN-таблицей" (таблицей номеров потоков)). Ссылочная информация 2801 о клипах является информацией для идентификации файла 231 информации о двумерных клипах. Время 2802 начала воспроизведения и время 2803 окончания воспроизведения, соответственно, указывают PTS для начала и конца секции для воспроизведения файла 2D 241. Условие 2804 соединения указывает условие для соединения видео в секции воспроизведения, указанной посредством времени 2802 начала воспроизведения и времени 2803 окончания воспроизведения, с видео в секции воспроизведения, указанной посредством предыдущего PI #(N-1). STN-таблица 2805 является списком элементарных потоков, которые могут выбираться из файла 2D 241 посредством декодера в устройстве 102 воспроизведения от времени 2802 начала воспроизведения до времени 2803 окончания воспроизведения.
Структура данных SUB_PI является идентичной структуре данных PI, показанной на фиг. 28, в том, что она включает в себя ссылочную информацию о клипах, время начала воспроизведения и время окончания воспроизведения. В частности, время начала воспроизведения и время окончания воспроизведения SUB_PI выражаются как значения вдоль временной оси, идентичной оси PI. SUB_PI дополнительно включает в себя поле "условия SP-соединения". Условие SP-соединения имеет смысл, совпадающий с условием соединения PI.
[Условие соединения]
Условию соединения (в дальнейшем сокращенно как "CC") 2804 может, например, назначаться три типа значений, "1", "5" и "6". Когда CC 2804 равно "1", видео, которое должно воспроизводиться из секции файла 2D 241, указываемой посредством PI #N, не должно плавно соединяться с видео, воспроизводимым из секции файла 2D 241, указываемой посредством непосредственно предыдущего PI #(N-1). С другой стороны, когда CC 2804 указывает "5" или "6", оба видеоизображения должны быть плавно соединены.
Фиг. 29A и 29B являются схематичными представлениями, показывающими соответствие между двумя секциями 2901 и 2902 воспроизведения, которые должны соединяться, когда CC равно "5" или "6". В этом случае, PI #(N-1) указывает первую секцию 2901 в файле 2D 241, и PI #N указывает вторую секцию 2902 в файле 2D 241. Как показано на фиг. 29A, когда CC указывает "5", STC этих двух PI, PI #(N-1) и PI #N, могут быть непоследовательными. Таким образом, PTS #1 в конце первой секции 2901 и PTS #2 в начале второй секции 2902 могут быть непоследовательными. Тем не менее, должны удовлетворяться несколько ограничивающих условий. Например, первая секция 2901 и вторая секция 2902 должны создаваться так, что декодер может плавно продолжать декодировать данные, даже когда вторая секция 2902 предоставляется в декодер последовательно после первой секции 2901. Кроме того, последний кадр аудиопотока, содержащегося в первой секции 2901, должен перекрывать первый кадр аудиопотока, содержащегося во второй секции 2902. С другой стороны, как показано на фиг. 29B, когда CC указывает "6", первая секция 2901 и вторая секция 2902 должны иметь возможность обработки как последовательных секций для декодера, чтобы должным образом декодировать. Таким образом, STC и ATC должны быть смежными между первой секцией 2901 и второй секцией 2902. Аналогично, когда условие SP-соединения составляет "5" или "6", STC и ATC должны быть смежными между секциями файла 2D, указанного посредством двух смежных SUB_PI.
[STN-таблица]
Снова ссылаясь на фиг. 28, STN-таблица 2805 является матрицей информации регистрации потоков. "Информация регистрации потоков" - это информация, по отдельности перечисляющая элементарные потоки, которые могут выбираться для воспроизведения из основного TS между временем 2802 начала воспроизведения и временем 2803 окончания воспроизведения. Номер 2806 потока (STN) является порядковым номером, выделенным по отдельности информации регистрации потоков, и используется посредством устройства 102 воспроизведения, чтобы идентифицировать каждый элементарный поток. STN 2806 дополнительно указывает приоритет для выбора из элементарных потоков одного типа. Информация регистрации потоков включает в себя запись 2809 потока и информацию 2810 атрибутов потока. Запись 2809 потока включает в себя информацию 2807 пути потока и идентификационную информацию 2808 потока. Информация 2807 пути потока является информацией, указывающей файл 2D, которому принадлежит выбранный элементарный поток. Например, если информация 2807 пути потока указывает "основной путь", файл 2D соответствует файлу информации о двумерных клипах, указанному посредством ссылочной информации 2801 о клипах. С другой стороны, если информация 2807 пути потока указывает "идентификатор подпути=1", файл 2D, которому принадлежит выбранный элементарный поток, соответствует файлу информации о двумерных клипах, указанному посредством ссылочной информации о клипах SUB_PI, включенного в подпуть с идентификатором подпути=1. Время начала воспроизведения и время окончания воспроизведения, указанные посредством этого SUB_PI, включаются в интервал от времени 2802 начала воспроизведения до времени 2803 окончания воспроизведения, указанный посредством PI, включенного в STN-таблицу 2805. Идентификационная информация 2808 потока указывает PID для элементарного потока, мультиплексированного в файле 2D, указанном посредством информации 2807 пути потока. Элементарный поток, указанный посредством этого PID, может выбираться от времени 2802 начала воспроизведения до времени 2803 окончания воспроизведения. Информация 2810 атрибутов потока указывает информацию атрибутов для каждого элементарного потока. Например, информация атрибутов для каждого из аудиопотока, PG-потока и IG-потока указывает языковой тип потока.
[Воспроизведение двумерных видеоизображений в соответствии с файлом списков для двумерного воспроизведения]
Фиг. 30 является схематичным представлением, показывающим соответствие между PTS, указываемыми посредством файла 221 списков для двумерного воспроизведения (00001.mpls), и секциями, воспроизводимыми из файла 2D (01000.m2ts) 241. Как показано на фиг. 30, в основном пути 2701 в файле 221 списков для двумерного воспроизведения, PI #1 указывает PTS #1, которая указывает время IN1 начала воспроизведения, и PTS #2, которая указывает время OUT1 окончания воспроизведения. Ссылочная информация о клипах для PI #1 указывает файл 231 информации о двумерных клипах (01000.clpi). При воспроизведении двумерных видеоизображений в соответствии с файлом 221 списков для двумерного воспроизведения, устройство 102 воспроизведения сначала считывает PTS #1 и PTS #2 из PI #1. Затем, устройство 102 воспроизведения обращается к карте вхождений в файле 231 информации о двумерных клипах, чтобы извлекать из файла 2D 241 SPN #1 и SPN #2, которые соответствуют PTS #1 и PTS #2. Устройство 102 воспроизведения затем вычисляет соответствующие числа секторов из SPN #1 и SPN #2. Кроме того, устройство 102 воспроизведения обращается к этим числам секторов и записи файла для файла 2D 241, чтобы указывать LBN #1 и LBN #2 в начале и конце, соответственно, группы P1 секторов, в которую записана группа EXT2D[0], ..., EXT2D[n] двумерных экстентов, которая должна воспроизводиться. Вычисление чисел секторов и задание LBN осуществляется согласно описанию на фиг. 23B и 23C. В завершение, устройство 102 воспроизведения указывает диапазон от LBN #1 до LBN #2 в BD-ROM-накопитель 121. Группа исходных пакетов, принадлежащая группе EXT2D[0], ..., EXT2D[n] двумерных экстентов, тем самым считывается из группы P1 секторов в этом диапазоне. Аналогично, пара из PTS #3 и PTS #4, указываемая посредством PI #2, сначала преобразуется в пару из SPN #3 и SPN #4 посредством обращения к карте вхождений в файле 231 информации о двумерных клипах. Затем, при обращении к записи файла для файла 2D 241, пара из SPN #3 и SPN #4 преобразуется в пару из LBN #3 и LBN #4. Кроме того, группа исходных пакетов, принадлежащая группе двумерных экстентов, считывается из группы P2 секторов в диапазоне от LBN #3 до LBN #4. Преобразование пары из PTS #5 и PTS #6, указываемой посредством PI #3, в пару из SPN #5 и SPN #6, преобразование пары из SPN #5 и SPN #6 в пару из LBN #5 и LBN #6 и считывание группы исходных пакетов из группы P3 секторов в диапазоне от LBN #5 до LBN #6 выполняется аналогично. Устройство 102 воспроизведения тем самым воспроизводит двумерные видеоизображения из файла 2D 241 в соответствии с основным путем 2701 в файле 221 списков для двумерного воспроизведения.
Файл 221 списков для двумерного воспроизведения может включать в себя метку 3001 входа. Метка 3001 входа указывает момент времени в основном пути 2701, в который должно фактически начинаться воспроизведение. Например, как показано на фиг. 30, множество меток 3001 входа может задаваться для PI #1. Метка 3001 входа, в частности, используется для выполнения поиска позиции начала воспроизведения во время произвольного доступа. Например, когда файл 221 списков для двумерного воспроизведения указывает путь воспроизведения для тайтла фильма, метки 3001 входа назначаются началу каждой главы. Следовательно, устройство 102 воспроизведения может воспроизводить тайтл фильма по главам.
<<Файл списков для трехмерного воспроизведения>>
Фиг. 31 является схематичным представлением, показывающим структуру данных файла списков для трехмерного воспроизведения. Второй файл 222 списков воспроизведения (00002.mpls), показанный на фиг. 2, имеет эту структуру данных, как и третий файл 223 списков воспроизведения (00003.mpls). Как показано на фиг. 31, файл 222 списков для трехмерного воспроизведения включает в себя основной путь 3101, подпуть 3102 и расширенные данные 3103.
Основной путь 3101 указывает путь воспроизведения основного TS, показанного на фиг. 3A. Соответственно, основной путь 3101 является практически идентичным основному пути 2701 для файла 221 списков для двумерного воспроизведения, показанного на фиг. 27. Другими словами, устройство 102 воспроизведения в режиме двумерного воспроизведения может воспроизводить двумерные видеоизображения из файла 2D 241 в соответствии с основным путем 3101 в файле 222 списков для трехмерного воспроизведения. Основной путь 3101 отличается от основного пути 2701, показанного на фиг. 27, тем, что, когда STN ассоциирован с PID в графическом потоке, STN-таблица для каждого PI выделяет идентификатор последовательности смещений для STN.
Подпуть 3102 указывает путь воспроизведения для суб-TS, показанного на фиг. 3B, т.е. путь воспроизведения для файла DEP 242 или 243. Подпуть 3102 также может указывать путь воспроизведения для потока текстовых субтитров, показанного на фиг. 3C. Структура данных подпути 3102 является идентичной структуре данных подпутей 2702 и 2703 в файле 241 списков для двумерного воспроизведения, показанном на фиг. 27. Соответственно, подробности этой аналогичной структуры данных могут быть обнаружены в описании по фиг. 27, в частности, подробности структуры данных SUB_PI.
SUB_PI #N (N=1, 2, 3, ...) в подпути 3102 находятся в соответствии "один-к-одному" с PI #N в основном пути 3101. Кроме того, время начала воспроизведения и время окончания воспроизведения, указанные посредством каждого SUB_PI #N, являются идентичными времени начала воспроизведения и времени окончания воспроизведения, указанным посредством соответствующего PI #N. Подпуть 3102 дополнительно включает в себя тип 3110 подпути. "Тип подпути", в общем, указывает то, должна или нет обработка воспроизведения синхронизироваться между основным путем и подпутем. В файле 222 списков для трехмерного воспроизведения, тип 3110 подпути, в частности, указывает тип режима трехмерного воспроизведения, т.е. тип видеопотока для воспроизведения зависимого вида, который должен воспроизводиться в соответствии с подпутем 3110. На фиг. 31, значением типа 4021 подпути является "трехмерный L/R", тем самым указывая, что режимом трехмерного воспроизведения является L/R-режим, т.е. что видеопоток для просмотра правым глазом должен воспроизводиться. С другой стороны, значение "трехмерной глубины" для типа 3110 подпути указывает то, что режимом трехмерного воспроизведения является режим глубины, т.е. что поток карт глубины должен воспроизводиться. Когда устройство 102 воспроизведения в режиме трехмерного воспроизведения обнаруживает, что значением типа 3110 подпути является "трехмерный L/R" или "трехмерная глубина", устройство 102 воспроизведения синхронизирует обработку воспроизведения, которая соответствует основному пути 3101, с обработкой воспроизведения, которая соответствует подпути 3102.
Расширенные данные 3103 интерпретируются посредством устройства 102 воспроизведения только в режиме трехмерного воспроизведения; устройство 102 воспроизведения в режиме двумерного воспроизведения игнорирует расширенные данные 3103. В частности, расширенные данные 3103 включают в себя таблицу 3130 выбора расширенного потока. "Таблица выбора расширенного потока (STN_table_SS)" (в дальнейшем сокращенно как "STN-таблица SS") является матрицей информации регистрации потоков, которая должна добавляться к STN-таблицам, указываемым посредством каждого PI в основном пути 3101 во время трехмерного воспроизведения режим. Эта информация регистрации потоков указывает элементарные потоки, которые могут выбираться для воспроизведения из суб-TS.
[STN-таблица]
Фиг. 32 является схематичным представлением, показывающим STN-таблицу 3205, включенную в основной путь 3101 файла 222 списков для трехмерного воспроизведения. Как показано на фиг. 32, идентификационная информация 3208 потока, выделяемая для STN 3206=5, 6, ..., 11, указывает PID для PG-потока или IG-потока. В этом случае, информация 3210 атрибутов потока, выделяемая для STN 3206=5, 6, ..., 11, дополнительно включает в себя идентификатор 3201 опорного смещения и значение 3202 регулирования смещения.
В файле DEP 242, как показано на фиг. 11, метаданные 1110 смещения размещаются в VAU #1 каждой видеопоследовательности. Идентификатор 3201 опорного смещения (stream_ref_offset_id) является идентичным одному из идентификаторов 1111 последовательностей смещений, включенных в метаданные 1110 смещения. Другими словами, идентификатор 3201 опорного смещения задает последовательность смещений, которая должна быть ассоциирована с каждым из STN 3206=5, 6, ..., 11, из множества последовательностей смещений, включенных в метаданные 1110 смещения.
Значение 3202 регулирования смещения (stream_offset_adjustment) указывает значение, которое должно прибавляться к каждому значению смещения, включенному в последовательность смещений, заданную посредством идентификатора 3201 опорного смещения. Значение 3202 регулирования смещения, например, прибавляется посредством устройства 102 воспроизведения к каждому значению смещения, когда размер экрана дисплейного устройства 103 отличается от размера, который предположен во время создания трехмерного видеосодержимого. Таким образом, бинокулярный параллакс между двумерными графическими изображениями для просмотра левым глазом и для просмотра правым глазом может поддерживаться в соответствующем диапазоне.
[STN-таблица SS]
Фиг. 33 является схематичным представлением, показывающим структуру данных STN-таблицы SS 3130. Как показано на фиг. 33, STN-таблица SS 3130 включает в себя последовательности 3301, 3302, 3303, ... информации регистрации потоков. Последовательности 3301, 3302, 3303, ... информации регистрации потоков по отдельности соответствуют PI #1, PI #2, PI #3, ... в основном пути 3101 и используются посредством устройства 102 воспроизведения в режиме трехмерного воспроизведения в комбинации с последовательностями информации регистрации потоков, включенными в STN-таблицы в соответствующих PI. Последовательность 3301 информации регистрации потоков, соответствующая каждому PI, включает в себя смещение в ходе отображения всплывающего меню (Fixed_offset_during_Popup) 3311 и последовательность 3312 информации регистрации потоков для видеопотоков для воспроизведения зависимого вида.
Смещение в ходе отображения всплывающего меню 3311 указывает то, воспроизводится или нет всплывающее меню из IG-потока. Устройство 102 воспроизведения в режиме трехмерного воспроизведения изменяет режим представления видеоплоскости и графической плоскости в соответствии со значением смещения 3311. Предусмотрено два типа режимов представления для видеоплоскости: режим представления для воспроизведения базового вида (B) - для воспроизведения зависимого вида (D) и режим представления B-B. Предусмотрено два типа режимов представления для графической плоскости: режим 1 плоскости+смещения и режим 1 плоскости+нулевого смещения. Например, когда значение смещения в ходе отображения всплывающего меню 3311 равно "0", всплывающее меню не воспроизводится из IG-потока. Здесь, режим представления B-D выбирается в качестве режима представления в видеоплоскости, а режим 1 плоскости+смещения выбирается в качестве режима представления для графической плоскости. С другой стороны, когда значение смещения в ходе отображения всплывающего меню 3311 равно "1", всплывающее меню воспроизводится из IG-потока. Здесь, режим представления B-B выбирается в качестве режима представления в видеоплоскости, а режим 1 плоскости+нулевого смещения выбирается в качестве режима представления для PG-плоскости.
В "режиме представления B-D" устройство 102 воспроизведения поочередно выводит видеоплоскости для просмотра левым глазом и правым глазом. Соответственно, поскольку кадры для просмотра левым глазом и правым глазом поочередно отображаются на экране дисплейного устройства 103, зритель воспринимает эти кадры как трехмерные видеоизображения. В "режиме представления B-B" устройство 102 воспроизведения выводит данные плоскости, декодированные только из видеопотока для воспроизведения базового вида два раза для кадра, при сохранении рабочего режима в режиме трехмерного воспроизведения (в частности, при сохранении частоты кадров при значении для трехмерного воспроизведения, к примеру, 48 кадров/секунда). Соответственно, только либо видеоплоскость для просмотра левым глазом, либо видеоплоскость для просмотра правым глазом отображается на экране устройства 103 воспроизведения, и тем самым зритель воспринимает эти видеоплоскости просто как двумерные видеоизображения.
В "режиме 1 плоскости+смещения" устройство 102 воспроизведения формирует, через управление смещением, пару графических плоскостей для просмотра левым глазом и правым глазом из графического потока в основном TS и поочередно выводит эти графические плоскости. Соответственно, графические плоскости для просмотра левым глазом и правым глазом поочередно отображаются на экране дисплейного устройства 103, и тем самым зритель воспринимает эти кадры как трехмерные графические изображения. В "режиме 1 плоскости+нулевого смещения" устройство 102 воспроизведения временно прекращает управление смещением и выводит графическую плоскость, декодированную из графического потока в основном TS, два раза для кадра при сохранении рабочего режима в режиме трехмерного воспроизведения. Соответственно, только либо графические плоскости для просмотра левым глазом, либо графические плоскости для просмотра правым глазом отображаются на экране дисплейного устройства 103, и тем самым зритель воспринимает эти плоскости просто как двумерные графические изображения.
Устройство 102 воспроизведения в режиме трехмерного воспроизведения обращается к смещению в ходе отображения всплывающего меню 3311 для каждого PI и выбирает режим представления B-B и режим 1 плоскости+нулевого смещения, когда всплывающее меню воспроизводится из IG-потока. В то время, когда всплывающее меню отображается, другие трехмерные видеоизображения тем самым временно изменяются на двумерные видеоизображения. Это улучшает видимость, а также повышает и удобство и простоту использования всплывающего меню.
Последовательность 3312 информации регистрации потоков для видеопотока для воспроизведения зависимого вида включает в себя информацию регистрации потоков, указывающую видеопотоки для воспроизведения зависимого вида, которые могут выбираться для воспроизведения из суб-TS. Эта последовательность 3312 информации регистрации потоков используется в комбинации с одной из последовательностей информации регистрации потоков, включенных в STN-таблицу в соответствующем PI, который указывает видеопоток для воспроизведения базового вида. При считывании фрагмента информации регистрации потоков из STN-таблицы устройство 102 воспроизведения в режиме трехмерного воспроизведения также автоматически считывает последовательность информации регистрации потоков, расположенную в STN-таблице SS, которая комбинирована с фрагментом информации регистрации потоков. При простом переключении режима двумерного воспроизведения на режим трехмерного воспроизведения устройство 102 воспроизведения тем самым может поддерживать уже распознанные STN и атрибуты потока, такие как язык.
Как показано на фиг. 33, последовательность 3312 информации регистрации потоков в видеопотоке для воспроизведения зависимого вида, в общем, включает в себя множество фрагментов информации 3320 регистрации потоков (SS_dependent_view_block). Их число является идентичным числу фрагментов информации регистрации потоков в соответствующем PI, которые указывают видеопоток для воспроизведения базового вида. Каждый фрагмент информации 3320 регистрации потоков включает в себя STN 3321, запись 3322 потока и информацию 3323 атрибутов потока. STN 3321 является порядковым номером, назначенным по отдельности фрагментам информации 3320 регистрации потоков, и является идентичным STN фрагмента информации регистрации потоков, расположенной в соответствующем PI, с которым комбинируется фрагмент информации 3320 регистрации потоков. Запись 3322 потока включает в себя ссылочную информацию 3331 идентификаторов подпутей (ref_to_Subpath_id), ссылочную информацию 3332 файлов потока (ref_to_subClip_entry_id) и PID (ref_to_stream_PID_subclip) 3333. Ссылочная информация 3331 идентификаторов подпутей указывает идентификатор подпути для подпути, который указывает путь воспроизведения видеопотока для воспроизведения зависимого вида. Ссылочная информация 3332 файлов потока является информацией, чтобы идентифицировать файл DEP, сохраняющий этот видеопоток для воспроизведения зависимого вида. PID 3333 является PID для этого видеопотока для воспроизведения зависимого вида. Информация 3323 атрибутов потока включает в себя атрибуты для этого видеопотока для воспроизведения зависимого вида, такие как частота кадров, разрешение и видеоформат. В частности, эти атрибуты являются идентичными атрибутам видеопотока для воспроизведения базового вида, показанного посредством фрагмента информации регистрации потоков, включенной в соответствующем PI, с которым комбинируется каждый фрагмент информации регистрации потоков.
[Воспроизведение трехмерных видеоизображений в соответствии с файлом списков для трехмерного воспроизведения]
Фиг. 34 является схематичным представлением, показывающим соответствие между PTS, указываемыми посредством файла 222 списков для трехмерного воспроизведения (00002.mpls), и секциями, воспроизводимыми из файла SS (01000.ssif) 244A. Как показано на фиг. 34, в основном пути 3401 в файле 222 списков для трехмерного воспроизведения, PI #1 указывает PTS #1, которая указывает время IN1 начала воспроизведения, и PTS #2, которая указывает время OUT1 окончания воспроизведения. Ссылочная информация о клипах для PI #1 указывает файл 231 информации о двумерных клипах (01000.clpi). В подпути 3402, который указывает то, что типом подпути является "трехмерный L/R", SUB_PI #1 указывает PTS #1 и PTS #2, идентичные PTS #1 и PTS #2 для PI #1. Ссылочная информация о клипах для SUB_PI #1 указывает файл 232 информации о клипах для воспроизведения зависимого вида (02000.clpi).
При воспроизведении трехмерных видеоизображений в соответствии с файлом 222 списков для трехмерного воспроизведения, устройство 102 воспроизведения сначала считывает PTS #1 и PTS #2 из PI #1 и SUB_PI #1. Затем, устройство 102 воспроизведения обращается к карте вхождений в файле 231 информации о двумерных клипах, чтобы извлекать из файла 2D 241 SPN #1 и SPN #2, которые соответствуют PTS #1 и PTS #2. Параллельно, устройство 102 воспроизведения обращается к карте вхождений в файле 232 информации о клипах для воспроизведения зависимого вида, чтобы извлекать из первого файла DEP 242 SPN #11 и SPN #12, которые соответствуют PTS #1 и PTS #2. Как описано со ссылкой на фиг. 24E, устройство 102 воспроизведения затем использует начальные точки 2242 и 2420 экстентов в файлах 231 и 232 информации о клипах, чтобы вычислять, из SPN #1 и SPN #11, число исходных пакетов SPN #21 с начала файла SS 244A до позиции начала воспроизведения. Аналогично, устройство 102 воспроизведения вычисляет, из SPN #2 и SPN #12, число исходных пакетов SPN #22 с начала файла SS 244A до позиции начала воспроизведения. Устройство 102 воспроизведения дополнительно вычисляет числа секторов, соответствующих SPN #21 и SPN #22. Затем, устройство 102 воспроизведения обращается к этим числам секторов и записи файла в файле SS 244A, чтобы указывать LBN #1 и LBN #2 в начале и конце, соответственно, группы P11 секторов, в которую записана группа EXTSS[0], ..., EXTSS[n] экстентов SS, которая должна воспроизводиться. Вычисление чисел секторов и задание LBN осуществляется согласно описанию фиг. 33E. В завершение, устройство 102 воспроизведения указывает диапазон от LBN #1 до LBN #2 в BD-ROM-накопитель 121. Группа исходных пакетов, принадлежащая группе EXTSS[0], ..., EXTSS[n] экстентов SS, тем самым считывается из группы P11 секторов в этом диапазоне. Аналогично, пара из PTS #3 и PTS #4, указываемая посредством PI #2 и SUB_PI #2, сначала преобразуется в пару из SPN #3 и SPN #4 и пару из SPN #13 и SPN #14 посредством обращения к карте вхождений в файлах 231 и 232 информации о клипах. Затем, число исходных пакетов SPN #23 с начала файла SS 244A до позиции начала воспроизведения вычисляется из SPN #3 и SPN #13, и число исходных пакетов SPN #24 с начала файла SS 244A до позиции окончания воспроизведения вычисляется из SPN #4 и SPN #14. Затем при обращении к записи файла для файла SS 244A, пара из SPN #23 и SPN #24 преобразуется в пару из LBN #3 и LBN #4. Кроме того, группа исходных пакетов, принадлежащая группе экстентов SS, считывается из группы P12 секторов в диапазоне от LBN #3 до LBN #4.
Параллельно с вышеописанной обработкой считывания, как описано со ссылкой на фиг. 24E, устройство 102 воспроизведения обращается к начальным точкам 2242 и 2420 экстентов в файлах 231 и 232 информации о клипах, чтобы извлекать экстенты для воспроизведения базового вида из каждого экстента SS и декодировать экстенты для воспроизведения базового вида параллельно с оставшимися экстентами для воспроизведения зависимого вида. Устройство 102 воспроизведения тем самым может воспроизводить трехмерные видеоизображения из файла SS 244A в соответствии с файлом 222 списков для трехмерного воспроизведения.
<<Индексный файл>>
Фиг. 35 является схематичным представлением, показывающим структуру данных индексного файла (index.bdmv) 211, показанного на фиг. 2. Как показано на фиг. 35, индексный файл 211 включает в себя индексную таблицу 3510, флаг 3520 существования трехмерного режима и флаг 3530 предпочтения двумерного/трехмерного режима.
Индексная таблица 3510 сохраняет элементы "первый элемент воспроизведения" 3501, "главное меню" 3502 и "тайтл k" 3503 (k=1, 2, ..., n; буква n представляет целое число, превышающее или равное 1). Каждый элемент ассоциирован либо с кинообъектом MVO-2D, MVO-3D, ..., либо с BD-J-объектом BDJO-2D, BDJO-3D, ... Каждый раз, когда тайтл или меню вызывается в ответ на пользовательскую операцию или прикладную программу, модуль управления в устройстве 102 воспроизведения обращается к соответствующему элементу в индексной таблице 3510. Кроме того, модуль управления вызывает объект, ассоциированный с элементом из BD-ROM-диска 101, и, соответственно, выполняет множество процессов. В частности, элемент "первое воспроизведение" 3501 указывает объект, который должен вызываться, когда диск 101 загружается в BD-ROM-накопитель 121. Элемент "главное меню" 3502 указывает объект для отображения меню на дисплейном устройстве 103, когда команда "вернуться в меню" вводится, например, посредством пользовательской операции. В элементах "тайтл k" 3503, по отдельности выделяются тайтлы, которые составляют содержимое на диске 101. Например, когда тайтл для воспроизведения указывается посредством пользовательской операции, в элементе "тайтл k", в котором тайтл выделяется, объект для воспроизведения видеоизображений из файла AV-потока, соответствующего тайтлу, указывается.
В примере, показанном на фиг. 35, элементы "тайтл 1" и "тайтл 2" выделяются тайтлам двумерных видеоизображений. Кинообъект, ассоциированный с элементом "тайтл 1", MVO-2D, включает в себя группу команд, связанных с процессами воспроизведения для двумерных видеоизображений с использованием файла 221 списков для двумерного воспроизведения (00001.mpls). Когда устройство 102 воспроизведения обращается к элементу "тайтл 1", затем в соответствии с кинообъектом MVO-2D, файл 221 списков для двумерного воспроизведения считывается из диска 101, и процессы воспроизведения для двумерных видеоизображений выполняются в соответствии с путем воспроизведения, указанным в нем. BD-J-объект, ассоциированный с элементом "тайтл 2", BDJO-2D, включает в себя таблицу управления приложениями, связанную с процессами воспроизведения для двумерных видеоизображений, с использованием файла 221 списков для двумерного воспроизведения. Когда устройство 102 воспроизведения обращается к элементу "тайтл 2", затем в соответствии с таблицей управления приложениями в BD-J-объекте BDJO-2D, Java-приложение вызывается из файла 261 JAR и выполняется. Таким образом, файл 221 списков для двумерного воспроизведения считывается из диска 101, и процессы воспроизведения для двумерных видеоизображений выполняются в соответствии с путем воспроизведения, указанным в нем.
Кроме того, в примере, показанном на фиг. 35, элементы "тайтл 3" и "тайтл 4" выделяются тайтлам трехмерных видеоизображений. Кинообъект, ассоциированный с элементом "тайтл 3", MVO-3D, включает в себя, в дополнение к группе команд, связанных с процессами воспроизведения для двумерных видеоизображений с использованием файла 221 списков для двумерного воспроизведения, группу команд, связанных с процессами воспроизведения для трехмерных видеоизображений с использованием файла 222 списков для трехмерного воспроизведения (00002.mpls) или (00003.mpls) 223. В BD-J-объекте, ассоциированном с элементом "тайтл 4", BDJO-3D, таблица управления приложениями указывает, в дополнение к Java-приложению, связанному с процессами воспроизведения для двумерных видеоизображений с использованием файла 221 списков для двумерного воспроизведения, Java-приложение, связанное с процессами воспроизведения для трехмерных видеоизображений с использованием файла 222 или 223 списков для трехмерного воспроизведения.
Флаг 3520 существования трехмерного режима показывает то, записано или нет содержимое трехмерного видео на BD-ROM-диске 101. Когда BD-ROM-диск 101 вставляется в BD-ROM-накопитель 121, устройство 102 воспроизведения сначала проверяет флаг 3520 существования трехмерного режима. Когда флаг 3520 существования трехмерного режима снят, устройство 102 воспроизведения не должно выбирать режим трехмерного воспроизведения. Соответственно, устройство 102 воспроизведения может быстро переходить в режиме двумерного воспроизведения, без выполнения HDMI-аутентификации для дисплейного устройства 103. "HDMI-аутентификация" упоминается как обработка, посредством которой устройство 102 воспроизведения обменивается CEC-сообщениями с дисплейным устройством 103 через HDMI-кабель 122, чтобы проверять для дисплейного устройств 103 то, поддерживает оно или нет воспроизведение трехмерных видеоизображений. Посредством пропуска HDMI-аутентификации, время между вставкой BD-ROM-диска 101 и началом воспроизведения двумерных видеоизображений сокращается.
Флаг 3530 предпочтения двумерного/трехмерного режима указывает то, должно или нет воспроизведение трехмерных видеоизображений приоритезироваться, когда как устройство воспроизведения, так и дисплейное устройство поддерживают воспроизведение как двумерных, так и трехмерных видеоизображений. Флаг 3530 предпочтения двумерного/трехмерного режима задается поставщиком содержимого. Когда флаг 3520 существования трехмерного режима на BD-ROM-диске 101 помечен, устройство 102 воспроизведения затем дополнительно проверяет флаг 3530 предпочтения двумерного/трехмерного режима. Когда флаг 3530 предпочтения двумерного/трехмерного режима помечен, устройство 102 воспроизведения не заставляет пользователя выбирать режим воспроизведения, а вместо этого выполняет HDMI-аутентификацию. На основе ее результатов, устройство 102 воспроизведения работает либо в режиме двумерного воспроизведения, либо в режиме трехмерного воспроизведения. Таким образом, устройство 102 воспроизведения не отображает экран выбора режима воспроизведения. Соответственно, если результаты HDMI-аутентификации указывают то, что дисплейное устройство 103 поддерживает воспроизведение трехмерных видеоизображений, устройство 102 воспроизведения работает в режиме трехмерного воспроизведения. Это позволяет не допускать задержек в активации, вызываемых посредством обработки, чтобы переключаться из режима двумерного воспроизведения в режим трехмерного воспроизведения, к примеру, переключения частот кадров и т.д.
[Выбор файла списков воспроизведения при выборе тайтла трехмерного видео]
В примере, показанном на фиг. 35, когда устройство 102 воспроизведения обращается к элементу "тайтл 3" в индексной таблице 3510, следующие процессы определения выполняются в соответствии с кинообъектом MVO-3D: (1) Флаг 3520 существования трехмерного режима помечен или снят? (2) Устройство 102 воспроизведения само поддерживает воспроизведение трехмерных видеоизображений? (3) Флаг 3530 предпочтения двумерного/трехмерного режима помечен или снят? (4) Пользователь выбрал режим трехмерного воспроизведения? (5) Дисплейное устройство 103 воспроизведения поддерживает трехмерные видеоизображения? и (6) Режим трехмерного воспроизведения устройства 102 воспроизведения - L/R-режим или режим глубин? Затем, в соответствии с результатами этих определений, устройство 102 воспроизведения выбирает один из файлов 221-223 списков воспроизведения для воспроизведения. С другой стороны, когда устройство 102 воспроизведения обращается к элементу "тайтл 4", Java-приложение вызывается из файла 261 JAR в соответствии с таблицей управления приложениями в BD-J-объекте BDJO-3D и выполняется. Вышеописанные процессы определения (1)-(6) тем самым выполняются, и файл списков воспроизведения затем выбирается в соответствии с результатами определения.
Фиг. 36 является блок-схемой последовательности операций способа обработки выбора для файла списков воспроизведения, который должен воспроизводиться с использованием вышеуказанных процессов определения (1)-(6). Для этой обработки выбора допускается, что устройство 102 воспроизведения включает в себя первый флаг и второй флаг. Первый флаг указывает то, поддерживает или нет устройство 102 воспроизведения воспроизведение трехмерных видеоизображений. Например, значение "0" для первого флага указывает то, что устройство 102 воспроизведения поддерживает только воспроизведение двумерных видеоизображений, тогда как "1" указывает поддержку также трехмерных видеоизображений. Второй флаг указывает то, является режимом трехмерного воспроизведения L/R-режим или режим глубины. Например, значение "0" для второго флага указывает то, что режимом трехмерного воспроизведения является L/R-режим, тогда как "1" указывает режим глубины. Кроме того, соответствующие значения флага 3520 существования трехмерного режима и флага 3530 предпочтения двумерного/трехмерного режима задаются равными "1", когда эти флаги помечены, и "0", когда эти флаги сняты.
На этапе S3601, устройство 102 воспроизведения проверяет значение флага 3520 существования трехмерного режима. Если значение равно "1", обработка переходит к этапу S3602. Если значение равно "0", обработка переходит к этапу S3607.
На этапе S3602, устройство 102 воспроизведения проверяет значение первого флага. Если значение равно "1", обработка переходит к этапу S3603. Если значение равно "0", обработка переходит к этапу S3607.
На этапе S3603, устройство 102 воспроизведения проверяет значение флага 3530 предпочтения двумерного/трехмерного режима. Если значение равно "0", обработка переходит к этапу S3604. Если значение равно "1", обработка переходит к этапу S3605.
На этапе S3604, устройство 102 воспроизведения отображает меню на дисплейном устройстве 103 для пользователя, чтобы выбирать режим двумерного воспроизведения или режим трехмерного воспроизведения. Если пользователь выбирает режим трехмерного воспроизведения через операцию с пультом 105 дистанционного управления и т.п., обработка переходит к этапу S3605, при этом если пользователь выбирает режим двумерного воспроизведения, обработка переходит к этапу S3607.
На этапе S3605, устройство 102 воспроизведения выполняет HDMI-аутентификацию, чтобы проверять то, поддерживает или нет дисплейное устройство 103 воспроизведение трехмерных видеоизображений. В частности, устройство 102 воспроизведения обменивается CEC-сообщениями с дисплейным устройством 103 через HDMI-кабель 122, чтобы проверять дисплейное устройство 103 на предмет того, поддерживает оно или нет воспроизведение трехмерных видеоизображений. Если дисплейное устройство 103 поддерживает воспроизведение трехмерных видеоизображений, обработка переходит к этапу S3606. Если дисплейное устройство 103 не поддерживает воспроизведение трехмерных видеоизображений, обработка переходит к этапу S3607.
На этапе S3606, устройство 102 воспроизведения проверяет значение второго флага. Если значение равно "0", обработка переходит к этапу S3608. Если значение равно "1", обработка переходит к этапу S3609.
На этапе S3607, устройство 102 воспроизведения выбирает для воспроизведения файл 221 списков для двумерного воспроизведения. Следует отметить, что, в это время, устройство 102 воспроизведения может дать инструкцию дисплейному устройству 103 отображать причину, по которой воспроизведение трехмерных видеоизображений не выбрано. Обработка затем завершается.
На этапе S3608, устройство 102 воспроизведения выбирает для воспроизведения файл 222 списков для трехмерного воспроизведения используемый в L/R-режиме. Обработка затем завершается.
На этапе S3609, устройство 102 воспроизведения выбирает для воспроизведения файл 222 списков для трехмерного воспроизведения, используемый в режиме глубины. Обработка затем завершается.
<Структура устройства двумерного воспроизведения>
При воспроизведении содержимого двумерного видео из BD-ROM-диска 101 в режиме двумерного воспроизведения, устройство 102 воспроизведения работает как устройство двумерного воспроизведения. Фиг. 37 является функциональной блок-схемой устройства 3700 двумерного воспроизведения. Как показано на фиг. 37, устройство 3700 двумерного воспроизведения включает в себя BD-ROM-накопитель 3701, модуль 3702 воспроизведения и модуль 3703 управления. Модуль 3702 воспроизведения включает в себя буфер 3721 считывания, декодер 3725 системных целевых объектов и сумматор 3726 плоскостей. Модуль 3703 управления включает в себя запоминающее устройство 3731 динамических сценариев, запоминающее устройство 3732 статических сценариев, процессор 3733 пользовательских событий, модуль 3734 выполнения программ, модуль 3735 управления воспроизведением и модуль 3736 хранения переменных проигрывателя. Модуль 3702 воспроизведения и модуль 3703 управления реализованы на различных интегральных схемах, но альтернативно могут быть реализованы на одной интегральной схеме.
Когда BD-ROM-диск 101 загружается в BD-ROM-накопитель 3701, BD-ROM-накопитель 3701 испускает лазерное излучение на диск 101 и обнаруживает изменение в отраженном свете. Кроме того, с использованием изменения количества отраженного света, BD-ROM-накопитель 3701 считывает данные, записанные на диске 101. В частности, BD-ROM-накопитель 3701 имеет оптическую головку воспроизведения, т.е. оптическую головку. Оптическая головка имеет полупроводниковый лазер, коллимированную линзу, расщепитель луча, объектив, собирающую линзу и оптический детектор. Луч света, излучаемый из полупроводникового лазера, последовательно проходит через коллимированную линзу, расщепитель луча и объектив, чтобы собираться на слое для записи диска 101. Собранный луч отражается и дифрагируется посредством слоя для записи. Отраженный и дифрагированный свет проходит через объектив, расщепитель луча и собирающую линзу и собирается на оптическом детекторе. Оптический детектор формирует сигнал воспроизведения на уровне в соответствии с величиной собранного света. Кроме того, данные декодируются из сигнала воспроизведения.
BD-ROM-накопитель 3701 считывает данные из BD-ROM-диска 101 на основе запроса из модуля 3735 управления воспроизведением. Из считываемых данных экстенты в файле 2D, т.е. двумерные экстенты, передаются в буфер 3721 считывания; информация динамического сценария передается в запоминающее устройство 3731 динамических сценариев; и информация статического сценария передается в запоминающее устройство 3732 статических сценариев. "Информация динамического сценария" включает в себя индексный файл, файл кинообъектов и файл BD-J-объектов. "Информация статического сценария" включает в себя файл списков для двумерного воспроизведения и файл информации о двумерных клипах.
Буфер 3721 считывания, запоминающее устройство 3731 динамических сценариев и запоминающее устройство 3732 статических сценариев являются буферными запоминающими устройствами. Запоминающие элементы в модуле 3702 воспроизведения используются как буфер 3721 считывания. Запоминающие элементы в модуле 3703 управления используются как запоминающее устройство 3731 динамических сценариев и запоминающее устройство 3732 статических сценариев. Альтернативно, различные области в одном запоминающем элементе могут использоваться как часть или все эти буферные запоминающие устройства 3721, 3731 и 3732.
Декодер 3725 системных целевых объектов считывает двумерные экстенты из буфера 3721 считывания в единицах исходных пакетов и демультиплексирует двумерные экстенты. Декодер 3725 системных целевых объектов затем декодирует каждый из элементарных потоков, полученных посредством демультиплексирования. Здесь, информация, необходимая для декодирования каждого элементарного потока, такая как тип кодека и атрибуты потока, передается из модуля 3735 управления воспроизведением в декодер 3725 системных целевых объектов. Декодер 3725 системных целевых объектов выводит поток первичного видео, поток вторичного видео, IG-поток и PG-поток после декодирования, соответственно, как данные плоскости первичного видео, данные плоскости вторичного видео, данные IG-плоскости и данные PG-плоскости, в единицах VAU. С другой стороны, декодер 3725 системных целевых объектов смешивает декодированный поток первичного аудио и поток вторичного аудио и передает полученные в результате данные в устройство аудиовывода, такое как внутренний динамик 103A дисплейного устройства 103. Помимо этого, декодер 3725 системных целевых объектов принимает графические данные из модуля 3734 выполнения программ. Графические данные используются для рендеринга графических элементов для GUI, таких как меню, на экране и имеют формат растровых данных, такой как JPEG и PNG. Декодер 3725 системных целевых объектов обрабатывает графические данные и выводит обработанные данные как данные плоскости изображений. Подробности относительно декодера 3725 системных целевых объектов предоставляются ниже.
Сумматор 3726 плоскостей принимает данные плоскости первичного видео, данные плоскости вторичного видео, данные IG-плоскости, данные PG-плоскости и данные плоскости изображений из декодера 3725 системных целевых объектов и накладывает эти фрагменты данных плоскости, чтобы формировать один комбинированный видеокадр или поле. Комбинированные видеоданные передаются на дисплейное устройство 103 для отображения на экране.
Процессор 3733 пользовательских событий обнаруживает пользовательскую операцию через пульт 105 дистанционного управления или переднюю панель устройства 102 воспроизведения. На основе пользовательской операции, процессор 3733 пользовательских событий запрашивает модуль 3734 выполнения программ или модуль 3735 управления воспроизведением, чтобы выполнять обработку. Например, когда пользователь инструктирует отображать всплывающее меню посредством нажатия кнопки на пульте 105 дистанционного управления, процессор 3733 пользовательских событий обнаруживает нажатие и идентифицирует кнопку. Процессор 3733 пользовательских событий дополнительно запрашивает модуль 3734 выполнения программ, чтобы выполнять команду, соответствующую кнопке, т.е. команду для того, чтобы отображать всплывающее меню. С другой стороны, когда пользователь нажимает кнопку ускоренной перемотки вперед или назад на пульте 105 дистанционного управления, например, процессор 3733 пользовательских событий обнаруживает нажатие и идентифицирует кнопку. Процессор 3733 пользовательских событий затем запрашивает модуль 3735 управления воспроизведением, чтобы ускоренно перематывать вперед или перематывать назад в настоящий момент воспроизводимый список воспроизведения.
Модуль 3734 выполнения программ является процессором, который считывает программы из файлов кинообъектов и файлов BD-J-объектов, сохраненных в запоминающем устройстве 3731 динамических сценариев, и выполняет эти программы. Кроме того, модуль 3734 выполнения программ выполняет следующие операции в соответствии с программами: (1) модуль 3734 выполнения программ командует модулю 3735 управления воспроизведением выполнять обработку воспроизведения по списку воспроизведения; (2) модуль 3734 выполнения программ формирует графические данные для меню или игры как растровые данные PNG или JPEG и передает сформированные данные в декодер 3725 системных целевых объектов, чтобы комбинироваться с другими видеоданными. Через разработку программ конкретные подробности относительно этих процессов могут проектироваться относительно гибко. Другими словами, во время процесса авторской разработки BD-ROM-диска 101, характер этих процессов определяется в ходе программирования файлов кинообъектов и файлов BD-J-объектов.
Модуль 3735 управления воспроизведением управляет передачей различных типов данных, таких как двумерные экстенты, индексный файл и т.д. из BD-ROM-диска 101 в буфер 3721 считывания, запоминающее устройство 3731 динамических сценариев и запоминающее устройство 3732 статических сценариев. Файловая система, управляющая структурой каталогов/файлов, показанная на фиг. 2, используется для этого управления. Таким образом, модуль 3735 управления воспроизведением инструктирует BD-ROM-накопителю 3701 передавать файлы в каждое из буферных запоминающих устройств 3721, 3731 и 3732 с использованием системного вызова для открытия файлов. "Открытие файлов" состоит из последовательности следующих процессов. Прежде всего, имя файла, которое должно быть обнаружено, предоставляется в файловую систему посредством системного вызова, и осуществляется попытка обнаруживать имя файла из структуры каталогов/файлов. Когда обнаружение завершается удачно, запись файла для целевого файла, который должен быть передан, сначала передается в запоминающее устройство в модуле 3735 управления воспроизведением, и блок управления файлом (FCB) формируется в запоминающем устройстве. Затем, описатель файла для целевого файла возвращается из файловой системы в модуль 3735 управления воспроизведением. Впоследствии, модуль 3735 управления воспроизведением может инструктировать BD-ROM-накопителю 3701 передавать целевой файл из BD-ROM-диска 101 в каждое из буферных запоминающих устройств 3721, 3731 и 3732 посредством показа описателя файла BD-ROM-накопителю 3701.
Модуль 3735 управления воспроизведением декодирует файл AV-потока, чтобы выводить видеоданные и аудиоданные, посредством управления BD-ROM-накопителем 3701 и декодером 3725 системных целевых объектов. Конкретно, модуль 3735 управления воспроизведением сначала считывает файл списков для двумерного воспроизведения из запоминающего устройства 3732 статических сценариев в ответ на инструкцию из модуля 3734 выполнения программ или запрос из процессора 3733 пользовательских событий и интерпретирует содержимое файла. В соответствии с интерпретированным содержимым, в частности, с путем воспроизведения, модуль 3735 управления воспроизведением затем указывает файл 2D, который должен воспроизводиться, и инструктирует BD-ROM-накопителю 3701 и декодеру 3725 системных целевых объектов считывать и декодировать этот файл. Такая обработка воспроизведения на основе файла списков воспроизведения упоминается как "обработка воспроизведения списка воспроизведения".
Помимо этого, модуль 3735 управления воспроизведением задает различные типы переменных проигрывателя в модуле 3736 хранения переменных проигрывателя с использованием информации статического сценария. В отношении переменных проигрывателя модуль 3735 управления воспроизведением дополнительно указывает для декодера 3725 системных целевых объектов элементарные потоки, которые должны быть декодированы, и предоставляет информацию, необходимую для декодирования элементарных потоков.
Модуль 3736 хранения переменных проигрывателя состоит из группы регистров для сохранения переменных проигрывателя. Типы переменных проигрывателя включают в себя параметры системы (SPRM) и общие параметры (GPRM). SPRM указывает состояние устройства 102 воспроизведения. Фиг. 38 - это список SPRM. Как показано на фиг. 38, каждому SPRM назначается порядковый номер 3801, и каждый порядковый номер 3801 ассоциируется с уникальным значением 3802 переменной. Предоставляется, например, 64 SPRM. Содержимое основных SPRM приведено ниже. Здесь, числа в круглых скобках указывают порядковые номера 3801.
SPRM(0) - языковой код
SPRM(1) - номер потока первичного аудио
SPRM(2) - номер потока субтитров
SPRM(3) - номер ракурса
SPRM(4) - номер тайтла
SPRM(5) - номер главы
SPRM(6) - номер программы
SPRM(7) - номер ячейки
SPRM(8) - имя ключа
SPRM(9) - таймер навигации
SPRM(10) - текущее время воспроизведения
SPRM(11) - режим аудиомикширования проигрывателя для караоке
SPRM(12) - код страны для родительского контроля
SPRM(13) - уровень родительского контроля
SPRM(14) - конфигурация проигрывателя для видео
SPRM(15) - конфигурация проигрывателя для аудио
SPRM(16) - языковой код для аудиопотока
SPRM(17) - расширение языкового кода для аудиопотока
SPRM(18) - языковой код для потока субтитров
SPRM(19) - расширение языкового кода для потока субтитров
SPRM(20) - региональный код проигрывателя
SPRM(21) - номер потока вторичного видео
SPRM(22) - номер потока вторичного аудио
SPRM(23) - состояние проигрывателя
SPRM(24) - SPRM(63) - зарезервировано
SPRM(10) указывает PTS изображения, в данный момент декодированного, и обновляется каждый раз, когда изображение декодируется и записывается в запоминающее устройство плоскости первичного видео. Текущая точка воспроизведения может быть известна посредством обращения к SPRM(10).
Уровень родительского контроля в SPRM(13) указывает предварительно определенный ограниченный возраст и используется для родительского контроля просмотра тайтлов, записанных на BD-ROM-диске 101. Пользователь устройства 102 воспроизведения устанавливает значение SPRM(13) через, например, OSD устройства 102 воспроизведения. "Родительский контроль" означает ограничение просмотра тайтла в соответствии с возрастом зрителя. Ниже приводится пример того, как устройство 102 воспроизведения выполняет родительский контроль. Устройство 102 воспроизведения сначала считывает, из BD-ROM-диска 101, возраст, для которого просмотр тайтла разрешен, и затем сравнивает этот возраст со значением SPRM(13). Если этот возраст равен или меньше значения SPRM(13), устройство 102 воспроизведения продолжает воспроизведение тайтла. Если этот возраст превышает значение SPRM(13), устройство 102 воспроизведения прекращает воспроизведение тайтла.
Языковой код для аудиопотока в SPRM(16) и языковой код для потока субтитров в SPRM(18) показывают языковые коды по умолчанию устройства 102 воспроизведения. Эти коды могут изменяться пользователем с использованием OSD и т.п. устройства 102 воспроизведения, или коды могут изменяться посредством прикладной программы через модуль 3734 выполнения программ. Например, если SPRM(16) показывает "английский язык", то в ходе обработки воспроизведения списка воспроизведения, модуль 3735 управления воспроизведением сначала выполняет поиск в STN-таблице в PI, показывающем текущую секцию воспроизведения, т.е. текущем PI, на предмет записи потока, имеющей языковой код для "английского языка". Модуль 3735 управления воспроизведением затем извлекает PID из идентификационной информации потока записи потока и передает извлеченный PID в декодер 3725 системных целевых объектов. Как результат, аудиопоток, имеющий PID, выбирается и декодируется посредством декодера 3725 системных целевых объектов. Эти процессы могут выполняться посредством модуля 3735 управления воспроизведением с использованием файла кинообъектов или файла BD-J-объектов.
Во время обработки воспроизведения модуль 3735 управления воспроизведением обновляет переменные проигрывателя в соответствии с состоянием воспроизведения. Модуль 3735 управления воспроизведением, в частности, обновляет SPRM(1), SPRM(2), SPRM(21) и SPRM(22). Эти SPRM, соответственно, показывают, в заявленном порядке, STN для аудиопотока, потока субтитров, потока вторичного видео и потока вторичного аудио, которые в данный момент обрабатываются. Например, допустим, что SPRM(1) изменен посредством модуля 3734 выполнения программ. В этом случае, модуль 3735 управления воспроизведением сначала обращается к STN, показанному посредством нового SPRM(1), и извлекает запись потока, которая включает в себя этот STN, из STN-таблицы в текущем PI. Модуль 3735 управления воспроизведением затем извлекает PID из идентификационной информации потока записи потока и передает извлеченный PID в декодер 3725 системных целевых объектов. Как результат, аудиопоток, имеющий идентичный PID, выбирается и декодируется посредством декодера 3725 системных целевых объектов. Именно так аудиопоток, который должен воспроизводиться, переключается. Поток субтитров и поток вторичного видео, которые должны воспроизводиться, могут аналогично переключаться.
<<Обработка воспроизведения по списку для двумерного воспроизведения>>
Фиг. 39 является блок-схемой последовательности операций способа обработки воспроизведения по списку для двумерного воспроизведения посредством модуля 3735 управления воспроизведением. Обработка воспроизведения по списку для двумерного воспроизведения выполняется согласно файлу списков для двумерного воспроизведения и запускается посредством считывания посредством модуля 3735 управления воспроизведением файла списков для двумерного воспроизведения из запоминающего устройства 3732 статических сценариев.
На этапе S3901, модуль 3735 управления воспроизведением сначала считывает один PI из основного пути в файле списков для двумерного воспроизведения и затем задает PI в качестве текущего PI. Затем, из STN-таблицы текущего PI, модуль 3735 управления воспроизведением выбирает PID элементарных потоков, которые должны воспроизводиться, и указывает информацию атрибутов, необходимую для декодирования элементарных потоков. Выбранные PID и информация атрибутов указываются для декодера 3725 системных целевых объектов. Модуль 3735 управления воспроизведением дополнительно указывает SUB_PI, ассоциированный с текущим PI, из подпутей в файле списков для двумерного воспроизведения. После этого, обработка переходит к этапу S3902.
На этапе S3902, модуль 3735 управления воспроизведением считывает ссылочную информацию о клипах, PTS #1, указывающую время IN1 начала воспроизведения, и PTS #2, указывающую время OUT1 окончания воспроизведения, из текущего PI. Из этой ссылочной информации о клипах указывается файл информации о двумерных клипах, соответствующий файлу 2D, который должен воспроизводиться. Кроме того, когда существует SUB_PI, который ассоциирован с текущим PI, аналогичная информация также считывается из SUB_PI. После этого, обработка переходит к этапу S3903.
На этапе S3903, в отношении карты вхождений файла информации о двумерных клипах, модуль 3735 управления воспроизведением извлекает SPN #1 и SPN #2 в файле 2D, соответствующем PTS #1 и PTS #2. Пара PTS, указываемых посредством SUB_PI, также преобразуется в пару SPN. После этого, обработка переходит к этапу S3904.
На этапе S3904, из SPN #1 и SPN #2, модуль 3735 управления воспроизведением вычисляет число секторов, соответствующих каждому из SPN #1 и SPN #2. В частности, модуль 3735 управления воспроизведением сначала получает произведение каждого SPN #1 и SPN #2, умноженное на объем данных в расчете на исходный пакет, т.е. 192 байта. Затем, модуль 3735 управления воспроизведением получает частное посредством деления каждого произведения на объем данных в расчете на сектор, т.е. 2048 байтов: N1=SPN #1×192/2048, N2=SPN #2×192/2048. Частные N1 и N2 являются идентичными общему числу секторов, в основном TS, записанном в части до исходных пакетов, которым выделяются SPN #1 и SPN #2, соответственно. Пара из SPN, преобразованных из пары из PTS, указываемых посредством SUB_PI, аналогично преобразуется в пару чисел секторов. После этого, обработка переходит к этапу S3905.
На этапе S3905, модуль 3735 управления воспроизведением указывает, из чисел секторов N1 и N2, полученных на этапе S3904, LBN начала и конца группы двумерных экстентов, которая должна воспроизводиться. В частности, в отношении записи файла для файла 2D, который должен воспроизводиться, модуль 3735 управления воспроизведением подсчитывает с начала группы секторов, в которую группа двумерных экстентов записана, так что LBN (N1+1)-вого сектора=LBN #1, а LBN (N2+1)-вого сектора=LBN #2. Модуль 3735 управления воспроизведением дополнительно указывает диапазон от LBN #1 до LBN #2 в BD-ROM-накопитель 121. Пара чисел секторов, преобразованных из пары из PTS, указываемых посредством SUB_PI, аналогично преобразуется в пару из LBN и указывается в BD-ROM-накопитель 121. Как результат, из группы секторов в указанном диапазоне, группа исходных пакетов, принадлежащая группе двумерных экстентов, считывается в совмещенных единицах. После этого, обработка переходит к этапу S3906.
На этапе S3906, модуль 3735 управления воспроизведением проверяет то, остается или нет необработанный PI в основном пути. Когда необработанный PI остается, обработка повторяется с этапа S3901. Когда необработанных PI не остается, обработка завершается.
<<Декодер системных целевых объектов>>
Фиг. 40 является функциональной блок-схемой декодера 3725 системных целевых объектов. Как показано на фиг. 40, декодер 3725 системных целевых объектов включает в себя модуль 4010 депакетирования источников, ATC-счетчик 4020, первый синхросигнал 4030 на 27 МГц, PID-фильтр 4040, STC-счетчик (STC1) 4050, второй синхросигнал 4060 на 27 МГц, декодер 4070 первичного видео, декодер 4071 вторичного видео, PG-декодер 4072, IG-декодер 4073, декодер 4074 первичного аудио, декодер 4075 вторичного аудио, декодер 4076 текстовых субтитров, процессор 4080 изображений, запоминающее устройство 4090 плоскости первичного видео, запоминающее устройство 4091 плоскости вторичного видео, запоминающее устройство 4092 PG-плоскости, запоминающее устройство 4093 IG-плоскости, запоминающее устройство 4094 плоскости изображений и аудиомикшер 4095.
Модуль 4010 депакетирования источников считывает исходные пакеты из буфера 3721 считывания, извлекает TS-пакеты из считанных исходных пакетов и передает TS-пакеты в PID-фильтр 4040. Более того, модуль 4010 депакетирования источников синхронизирует время передачи со временем, показанным посредством ATS каждого исходного пакета. В частности, модуль 4010 депакетирования источников сначала отслеживает значение ATC, сформированного посредством ATC-счетчика 4020. В этом случае, значение ATC зависит от ATC-счетчика 4020 и увеличивается в соответствии с импульсом синхросигнала из первого синхросигнала 4030 на 27 МГц. Затем, в момент, когда значение ATC совпадает с ATS исходного пакета, модуль 4010 депакетирования источников передает TS-пакеты, извлеченные из исходного пакета, в PID-фильтр 4040. Посредством такого регулирования времени передачи, средняя скорость передачи TS-пакетов из модуля 4010 депакетирования источников в PID-фильтр 4040 не превышает значение RTS, указанное посредством системной скорости 2211 в файле 231 информации о двумерных клипах, показанном на фиг. 231.
PID-фильтр 4040 сначала отслеживает PID, который включает в себя каждый TS-пакет, выводимый посредством модуля 4010 депакетирования источников. Когда PID совпадает с PID, заранее указываемым посредством модуля 3735 управления воспроизведением, PID-фильтр 4040 выбирает TS-пакет и передает его в декодер 4070-4075 соответствующий декодированию элементарного потока, указанного посредством PID (декодер 4076 текстовых субтитров, тем не менее, исключается). Например, если PID равен 0x1011, TS-пакеты передаются в декодер 4070 первичного видео. TS-пакеты с PID в рамках 0x1B00-0x1B1F, 0x1100-0x111F, 0x1A00-0x1A1F, 0x1200-0x121F и 0x1400-0x141F передаются в декодер 4071 вторичного видео, декодер 4074 первичного аудио, декодер 4075 вторичного аудио, PG-декодер 4072 и IG-декодер 4073, соответственно.
PID-фильтр 4040 дополнительно обнаруживает PCR из TS-пакетов с использованием PID TS-пакетов. При каждом обнаружении PID-фильтр 4040 задает значение STC-счетчика 4050 равным предварительно определенному значению. Далее, значение счетчика 4050 STC увеличивается в соответствии с импульсом синхросигнала для второго синхросигнала 4060 на 27 МГц. Помимо этого, значение, равным которому задан счетчик 4050 STC, заранее указывается в PID-фильтр 4040 из модуля 3735 управления воспроизведением. Декодеры 4070-4076 используют значение STC-счетчика 4050 в качестве STC. В частности, декодеры 4070-4076 сначала восстанавливают TS-пакеты, принимаемые из PID-фильтра 4040, в PES-пакеты. Затем, декодеры 4070-4076 регулируют синхронизацию декодирования данных, включенных в рабочие PES-данные, в соответствии с временами, указываемыми посредством PTS или DTS, включенных в PES-заголовки.
Декодер 4070 первичного видео, как показано на фиг. 40, включает в себя буфер 4001 транспортных потоков (TB), буфер 4002 мультиплексирования (MB), буфер 4003 элементарных потоков (EB), декодер 4004 сжатого видео (DEC) и буфер 4005 декодированных изображений (DPB).
TB 4001, MB 4002 и EB 4003 являются буферными запоминающими устройствами и используют область запоминающего элемента, внутренне предоставленного в декодере 4070 первичного видео. Альтернативно, некоторые или все буферные запоминающие устройства могут разделяться на дискретные запоминающие элементы. TB 4001 сохраняет TS-пакеты, принимаемые из PID-фильтра 4040, как есть. MB 4002 сохраняет PES-пакеты, восстановленные из TS-пакетов, сохраненных в TB 4001. Следует отметить, что, когда TS-пакеты передаются из TB 4001 в MB 4002, TS-заголовок удаляется из каждого TS-пакета. EB 4003 извлекает кодированные VAU из PES-пакетов и сохраняет VAU. VAU включает в себя сжатое изображение, т.е. I-изображение, B-изображение или P-изображение. Следует отметить, что, когда данные передаются из MB 4002 в EB 4003, PES-заголовок удаляется из каждого PES-пакета.
DEC 4004 является аппаратным декодером специально для декодирования сжатых изображений и состоит из LSI, которая включает в себя, в частности, функцию, чтобы ускорять декодирование. DEC 4004 декодирует изображение из каждой VAU в EB 4003 во время, показанное посредством DTS, включенной в исходный PES-пакет. DEC 4004 также может обращаться к информации 1250 переключения декодирования, показанной на фиг. 12, чтобы декодировать изображения из каждой VAU последовательно, независимо от DTS. Во время декодирования DEC 4004 сначала анализирует заголовок VAU, чтобы указывать сжатое изображение, способ кодирования со сжатием и атрибут потока, сохраненные в VAU, выбирая способ декодирования в соответствии с этой информацией. Способы кодирования со сжатием включают в себя, например, MPEG-2, MPEG-4 AVC и VC1. Кроме того, DEC 4004 передает декодированное несжатое изображение в DPB 4005.
Аналогично TB 4001, MB 4002 и EB 4003, DPB 4005 является буферным запоминающим устройством, которое использует область встроенного запоминающего элемента в декодере 4070 первичного видео. Альтернативно, DPB 4005 может находиться в запоминающем элементе, отдельном от других буферных запоминающих устройств 4001, 4002 и 4003. DPB 4005 временно сохраняет декодированные изображения. Когда P-изображение или B-изображение должно быть декодировано посредством DEC 4004, DPB 4005 извлекает опорные изображения, в ответ на инструкцию из DEC 4004, из сохраненных декодированных изображений. DPB 4005 затем предоставляет опорные изображения в DEC 4004. Кроме того, DPB 4005 записывает сохраненные изображения в запоминающее устройство 4090 плоскости первичного видео во время, показанное посредством PTS, включенной в исходные PES-пакеты.
Декодер 4071 вторичного видео включает в себя структуру, идентичную структуре декодера 4070 первичного видео. Декодер 4071 вторичного видео сначала декодирует TS-пакеты потока вторичного видео, принимаемого из PID-фильтра 4040, в несжатые изображения. Затем, декодер 4071 вторичного видео записывает результирующие несжатые изображения в запоминающее устройство 4091 плоскости вторичного видео во время, показанное посредством PTS, включенных в PES-пакеты.
PG-декодер 4072 декодирует TS-пакеты, принимаемые из PID-фильтра 4040, в несжатые графические данные и записывает результирующие несжатые графические данные в запоминающее устройство 4092 PG-плоскости во время, показанное посредством PTS, включенных в PES-пакеты.
Фиг. 41A является блок-схемой последовательности операций способа обработки, посредством которого PG-декодер 4072 декодирует графический объект из одной записи данных в PG-потоке. Обработка запускается, когда PG-декодер 4072 принимает группу TS-пакетов, составляющих одну запись данных, показанную на фиг. 6, из PID-фильтра 4040. Фиг. 41B-41E являются принципиальными схемами, показывающими изменение графического объекта по мере того, как обработка выполняется.
На этапе S4101, PG-декодер 4072 сначала идентифицирует ODS, имеющий идентификатор объекта, идентичный идентификатору 605 опорного объекта в PCS. Затем, PG-декодер 4072 декодирует графический объект из идентифицированного ODS и записывает декодированный графический объект в буфер объектов. Здесь, "буфер объектов" является буферным запоминающим устройством, встроенным в PG-декодер 4072. "Знак улыбки" FOB, показанный на фиг. 41B, является примером графического объекта, записанного в буфер объектов.
На этапе S4102, PG-декодер 4072 выполняет процесс кадрирования в соответствии с информацией 602 кадрирования в PCS, извлекает часть графического объекта из графического объекта и записывает извлеченную часть в буфер объектов. Фиг. 41C показывает то, что, полосы LST и RST удаляются из левых и правых концов знака FOB улыбки, и оставшаяся часть OBJ записывается в буфер объектов.
На этапе S4103, PG-декодер 4072 сначала идентифицирует WDS, имеющий идентификатор окна, идентичный идентификатору 603 опорного окна в PCS. Затем, PG-декодер 4072 определяет позицию отображения графического объекта в графической плоскости из позиции 612 окна, указываемой посредством идентифицированного WDS и позиции 601 отображения объекта в PCS. На фиг. 41D, верхняя левая позиция окна WIN в графической плоскости GPL и верхняя левая позиция DSP графического объекта OBJ определяются.
На этапе S4104, PG-декодер 4072 записывает графический объект в буфере объектов в позицию отображения, определенную на этапе S4103. При этом PG-декодер 4072 определяет диапазон, в котором графический объект подготавливается посредством рендеринга посредством использования размера 613 окна, указываемого посредством WDS. На фиг. 41D, графический объект OBJ записывается в графическую плоскость GPL в диапазоне окна WIN с началом в верхней левой позиции DSP.
На этапе S4105, PG-декодер 4072 сначала идентифицирует PDS, имеющий идентификатор палитры, идентичный идентификатору 604 опорной палитры в PCS. Затем, PG-декодер 4072, посредством использования CLUT 622 в PDS, определяет значения цветовых координат, которые должны указываться посредством каждых пикселных данных в графическом объекте OBJ. На фиг. 41E, цвет каждого пиксела в графическом объекте OBJ определен. Таким образом, обработка рендеринга графического объекта, включенного в одну запись данных, завершается. Этапы S4101-S4105 выполняются по времени, указанному посредством PTS, включенной в тот же PES-пакет, что и графический объект.
IG-декодер 4073 декодирует TS-пакеты, принимаемые из PID-фильтра 4040, в несжатый графический объект. IG-декодер 4073 дополнительно записывает несжатый графический объект в запоминающее устройство 4093 IG-плоскости во время, показанное посредством PTS, включенных в PES-пакеты, восстановленные из TS-пакетов. Подробности относительно этих процессов являются идентичными PG-декодеру 4072.
Декодер 4074 первичного аудио сначала сохраняет TS-пакеты, принимаемые из PID-фильтра 4040, в буфер, предусмотренный в нем. Затем, декодер 4074 первичного аудио удаляет TS-заголовок и PES-заголовок из каждого TS-пакета в буфере и декодирует оставшиеся данные в несжатые LPCM-аудиоданные. Кроме того, декодер 4074 первичного аудио передает полученные в результате аудиоданные в аудиомикшер 4095 во время, показанное посредством PTS, включенной в исходный PES-пакет. Декодер 4074 первичного аудио выбирает способ декодирования для сжатых аудиоданных в соответствии со способом кодирования со сжатием и атрибутами потока для потока первичного аудио, включенного в TS-пакеты. Способы кодирования со сжатием включают в себя, например, AC-3 и DTS.
Декодер 4075 вторичного аудио имеет структуру, идентичную структуре декодера 4074 первичного аудио. Декодер 4075 вторичного аудио сначала восстанавливает PES-пакеты из TS-пакетов потока вторичного аудио, принимаемого из PID-фильтра 4040, и затем декодирует данные, включенные в рабочие PES-данные, в несжатые LPCM-аудиоданные. Затем, декодер 4075 вторичного аудио передает несжатые LPCM-аудиоданные в аудиомикшер 4095 во времена, показанные посредством PTS, включенных в PES-заголовки. Декодер 4075 вторичного аудио выбирает способ декодирования для сжатых аудиоданных в соответствии со способом кодирования со сжатием и атрибутами потока для потока вторичного аудио, включенного в TS-пакеты. Способы кодирования со сжатием включают в себя, например, Dolby Digital Plus и DTS-HD LBR.
Аудиомикшер 4095 принимает несжатые аудиоданные как из декодера 4074 первичного аудио, так и из декодера 4075 вторичного аудио и затем смешивает принимаемые данные. Аудиомикшер 4095 также передает синтезированный звук, получающийся посредством смешения аудиоданных, например, во внутреннем динамике 103A дисплейного устройства 103.
Процессор 4080 изображений принимает графические данные, т.е. растровые данные PNG или JPEG, из модуля 3734 выполнения программ. После приема графических данных процессор 4080 изображений подготавливает посредством рендеринга графические данные и записывает графические данные в запоминающее устройство 4094 плоскости изображений.
<Структура устройства трехмерного воспроизведения>
При воспроизведении трехмерного видеосодержимого из BD-ROM-диска 101 в режиме трехмерного воспроизведения, устройство 102 воспроизведения работает как устройство трехмерного воспроизведения. Фундаментальная часть структуры устройства является идентичной устройству двумерного воспроизведения, показанному на фиг. 37 и 40. Следовательно, ниже приводится описание секций структуры устройства двумерного воспроизведения, которые укрупнены или модифицированы. Подробности относительно фундаментальных частей устройства трехмерного воспроизведения могут быть обнаружены в вышеприведенном описании устройства двумерного воспроизведения. Устройство трехмерного воспроизведения также использует структуру, идентичную структуре устройства двумерного воспроизведения, для обработки воспроизведения по списку для двумерного воспроизведения. Соответственно, подробности относительно этой структуры могут быть обнаружены в описании устройства двумерного воспроизведения. Последующее описание предполагает обработку воспроизведения трехмерных видеоизображений в соответствии с файлами списков для трехмерного воспроизведения, т.е. обработку воспроизведения по списку для трехмерного воспроизведения.
Фиг. 42 является функциональной блок-схемой устройства 4200 трехмерного воспроизведения. Устройство 4200 трехмерного воспроизведения включает в себя BD-ROM-накопитель 4201, модуль 4202 воспроизведения и модуль 4203 управления. Модуль 4202 воспроизведения включает в себя переключатель 4220, первый буфер 4221 считывания (в дальнейшем в этом документе, сокращенно называется RB1), второй буфер 4222 считывания (в дальнейшем в этом документе, сокращенно называется RB2), декодер 4225 системных целевых объектов, сумматор 4226 плоскостей и модуль 4227 HDMI-связи. Модуль 4203 управления включает в себя запоминающее устройство 4231 динамических сценариев, запоминающее устройство 4232 статических сценариев, процессор 4233 пользовательских событий, модуль 4234 выполнения программ, модуль 4235 управления воспроизведением и модуль 4236 хранения переменных проигрывателя. Модуль 4202 воспроизведения и модуль 4203 управления реализованы на различных интегральных схемах, но альтернативно могут быть реализованы на одной интегральной схеме. В частности, запоминающее устройство 4231 динамических сценариев, запоминающее устройство 4232 статических сценариев, процессор 4233 пользовательских событий и модуль 4234 выполнения программ имеют идентичную структуру с устройством двумерного воспроизведения, показанным на фиг. 37. Соответственно, их подробности могут быть обнаружены в вышеприведенном описании устройства двумерного воспроизведения.
Когда инструктировано посредством модуля 4234 выполнения программ или другого модуля, чтобы выполнять обработку воспроизведения по списку для трехмерного воспроизведения, модуль 4235 управления воспроизведением считывает PI из файла списков для трехмерного воспроизведения, сохраненного в запоминающем устройстве 4232 статических сценариев, по порядку, задавая считанный PI в качестве текущего PL. Каждый раз, когда модуль 4235 управления воспроизведением задает текущий PI, он задает рабочий режим декодера 4225 системных целевых объектов и сумматора 4226 плоскостей в соответствии с STN-таблицей PI и STN-таблицей SS в файле списков для трехмерного воспроизведения. В частности, модуль 4235 управления воспроизведением выбирает PID элементарного потока для декодирования и передает PID, вместе с информацией атрибутов, необходимой для декодирования элементарного потока, в декодер 4225 системных целевых объектов. Если PG-поток или IG-поток включаются в элементарный поток, указываемый посредством выбранного PID, модуль 4235 управления воспроизведением указывает идентификатор 3201 опорного смещения и значение 3202 регулирования смещения, выделяемое потоковым данным, задавая идентификатор 3201 опорного смещения и значение 3202 регулирования смещения для SPRM(27) и SPRM(28) в модуле 4236 хранения переменных проигрывателя. Модуль 4235 управления воспроизведением также выбирает режим представления каждого фрагмента данных плоскости в соответствии со смещением в ходе отображения всплывающего меню 3311, указываемым посредством STN-таблицы SS, указывая выбранный режим представления в декодер 4225 системных целевых объектов и сумматор 4226 плоскостей.
Затем, в соответствии с текущим PI, модуль 4235 управления воспроизведением указывает диапазон LBN в группе секторов, записанной в экстент SS, который должен считываться в BD-ROM-накопитель 4201 через процедуры в описании фиг. 24E. Между тем, модуль 4235 управления воспроизведением обращается к начальным точкам экстентов в файле информации о клипах, сохраненном в запоминающем устройстве 4232 статических сценариев, чтобы формировать информацию, указывающую границу блоков данных в каждом экстенте SS. Эта информация указывает, например, число исходных пакетов с начала экстента SS до каждой границы. Модуль 4235 управления воспроизведением затем передает эту информацию в переключатель 4220.
Модуль 4236 хранения переменных проигрывателя включает в себя SPRM, показанные на фиг. 38, аналогично модулю 3736 хранения переменных проигрывателя в устройстве двумерного воспроизведения. Тем не менее, в отличие от фиг. 38, SPRM(24) включает в себя первый флаг, и SPRM(25) включает в себя второй флаг, как показано на фиг. 36. В этом случае, когда SPRM(24) равно "0", устройство 102 воспроизведения поддерживает только воспроизведение двумерных видеоизображений, а когда SPRM(24) равно "1", устройство 102 воспроизведения также поддерживает воспроизведение трехмерных видеоизображений. Устройство 102 воспроизведения находится в L/R-режиме, когда SPRM(25) равно "0", и находится в режиме глубины, когда SPRM(25) равно "1". Кроме того, устройство 102 воспроизведения находится в режиме двумерного воспроизведения, когда SPRM(25) равно "2".
Кроме того, в модуле 4236 хранения переменных проигрывателя, в отличие от фиг. 38, SPRM(27) включает в себя область хранения для идентификатора опорного смещения для каждой графической плоскости, а SPRM(28) включает в себя область хранения для значения регулирования смещения для каждой графической плоскости. Фиг. 43 является таблицей, показывающей структуру данных SPRM(27) и SPRM(28). Как показано на фиг. 43, SPRM(27) включает в себя область для сохранения четырех типов идентификаторов 4310-4313 опорного смещения. Эти идентификаторы 4310, 4311, 4312 и 4313 опорного смещения, соответственно, предназначены для PG-плоскости (PG_ref_offset_id), IG-плоскости (IG_ref_offset_id), плоскости вторичного видео (SV_ref_offset_id) и плоскости изображений (IM_ref_offset_id). SPRM(28) включает в себя область для сохранения четырех типов значений 4320-4323 регулирования смещения. Эти значения 4320, 4321, 4322 и 4323 регулирования смещения, соответственно, предназначены для PG-плоскости (PG_offset_adjustment), IG-плоскости (IG_offset_adjustment), плоскости вторичного видео (SV_offset_adjustment) и плоскости изображений (IM_offset_adjustment).
BD-ROM-накопитель 4201 включает в себя компоненты, идентичные компонентам BD-ROM-накопителя 3701 в устройстве двумерного воспроизведения, показанном на фиг. 37. При приеме из модуля 4235 управления воспроизведением индикатора диапазона LBN BD-ROM-накопитель 4201 считывает данные из секторов на BD-ROM-диске 101, как указано посредством диапазона. В частности, группа исходных пакетов, принадлежащая экстенту в файле SS, т.е. принадлежащая экстенту SS, передается из BD-ROM-накопителя 4201 в переключатель 4220. Каждый экстент SS включает в себя одну или более пар из блока данных для воспроизведения базового вида и зависимого вида, как показано на фиг. 19. Эти блоки данных должны быть переданы параллельно в различные RB1 4221 и RB2 4222. Соответственно, BD-ROM-накопитель 4201 должен иметь, по меньшей мере, такую же скорость доступа, как BD-ROM-накопитель 3701 в устройстве двумерного воспроизведения.
Переключатель 4220 принимает экстент SS из BD-ROM-накопителя 4201. С другой стороны, переключатель 4220 принимает, из модуля 4235 управления воспроизведением, информацию, указывающую границу в каждом блоке данных, включенном в экстент SS, т.е. число исходных пакетов с начала экстента SS до каждой границы. Переключатель 4220 затем обращается к этой информации (i), чтобы извлекать экстенты для воспроизведения базового вида из каждого экстента SS и передавать экстенты в RB1 4221 и (ii), чтобы извлекать экстенты для воспроизведения зависимого вида и передавать экстенты в RB2 4222.
RB1 4221 и RB2 4222 являются буферными запоминающими устройствами, которые используют запоминающий элемент в модуле 4202 воспроизведения. В частности, различные области в одном запоминающем элементе используются в качестве RB1 4221 и RB2 4222. Альтернативно, различные запоминающие элементы могут использоваться в качестве RB1 4221 и RB2 4222. RB1 4221 принимает экстенты для воспроизведения базового вида из переключателя 4220 и сохраняет эти экстенты. RB2 4222 принимает экстенты для воспроизведения зависимого вида из переключателя 4220 и сохраняет эти экстенты.
При обработке воспроизведения по списку для трехмерного воспроизведения декодер 4225 системных целевых объектов сначала принимает PID для потоковых данных, которые должны быть декодированы, а также информацию атрибутов, необходимую для декодирования потоковых данных, из модуля 4235 управления воспроизведением. Декодер 4225 системных целевых объектов затем считывает исходные пакеты поочередно из экстентов для воспроизведения базового вида, сохраненных в RB1 4221, и экстентов для воспроизведения зависимого вида, сохраненных в RB2 4222. Затем, декодер 4225 системных целевых объектов отделяет, из каждого исходного пакета, элементарные потоки, указываемые посредством PID, принимаемых из модуля 4235 управления воспроизведением, и декодирует элементарные потоки. Декодер 4225 системных целевых объектов затем записывает декодированные элементарные потоки во внутреннее запоминающее устройство плоскости согласно типу. Видеопоток для воспроизведения базового вида записывается в запоминающее устройство левой видеоплоскости, а видеопоток для воспроизведения зависимого вида записывается в запоминающее устройство правой видеоплоскости. С другой стороны, поток вторичного видео записывается в запоминающее устройство плоскости вторичного видео, IG-поток - в запоминающее устройство IG-плоскости, а PG-поток - в запоминающее устройство PG-плоскости. Когда поток вторичного видео состоит из пары видеопотока для воспроизведения базового вида и зависимого вида, отдельные запоминающие устройства плоскости вторичного видео подготавливаются к фрагментам данных плоскости для просмотра левым глазом и правым глазом. Декодер 4225 системных целевых объектов дополнительно подготавливает посредством рендеринга графические данные из модуля 4234 выполнения программ, такие как растровые данные JPEG, PNG и т.д., и записывает эти данные в запоминающее устройство плоскости изображений.
Декодер 4225 системных целевых объектов ассоциирует режим вывода данных плоскости из запоминающих устройств левой и правой видеоплоскости с режимом представления B-D и режимом представления B-B следующим образом. Когда модуль 4235 управления воспроизведением указывает режим представления B-D, декодер 4225 системных целевых объектов поочередно выводит данные плоскости из запоминающих устройств левой и правой видеоплоскости. С другой стороны, когда модуль 4235 управления воспроизведением указывает режим представления B-B, декодер 4225 системных целевых объектов выводит данные плоскости только из запоминающего устройства левой или правой видеоплоскости два раза в расчете на каждый кадр при сохранении рабочего режима в режиме трехмерного воспроизведения.
Когда модуль 4235 управления воспроизведением указывает режим 1 плоскости+смещения, то каждый раз, когда декодер 4225 системных целевых объектов считывает VAU в начале каждой видеопоследовательности из видеопотока для воспроизведения зависимого вида, декодер 4225 системных целевых объектов считывает метаданные 1110 смещения из VAU. В секции воспроизведения видеопоследовательности декодер 4225 системных целевых объектов сначала указывает PTS, сохраненную в идентичном PES-пакете вместе с каждой VAU, и указывает номер кадра, представленный посредством данных сжатых изображений VAU. Декодер 4225 системных целевых объектов затем считывает информацию смещения, ассоциированную с номером кадра, из метаданных смещения и передает информацию смещения в сумматор 4226 плоскостей во время, указываемое посредством указанной PTS.
Сумматор 4226 плоскостей принимает каждый тип данных плоскости из декодера 4225 системных целевых объектов и накладывает эти фрагменты данных плоскости друг на друга, чтобы создавать один комбинированный кадр или поле. В частности, в L/R-режиме, данные левой видеоплоскости представляют видеоплоскость для просмотра левым глазом, а данные плоскости для просмотра правым глазом представляют видеоплоскость для просмотра правым глазом. Соответственно, сумматор 4226 плоскостей накладывает другие данные плоскости, представляющие вид для просмотра левым глазом, на данные левой видеоплоскости, и накладывает другие данные плоскости, представляющие вид для просмотра правым глазом, на данные правой видеоплоскости. С другой стороны, в режиме глубины, данные правой видеоплоскости представляют карту глубины для видеоплоскости, представляющей данные левой видеоплоскости. Соответственно, сумматор 4226 плоскостей сначала формирует пару фрагментов для просмотра левым глазом и правым глазом для данных видеоплоскости из соответствующих фрагментов данных видеоплоскости. Затем, сумматор 4226 плоскостей выполняет обработку комбинирования, идентичную обработке в L/R-режиме.
При приеме индикатора относительно режима 1 плоскости+смещения или режима 1 плоскости+нулевого смещения из модуля 4235 управления воспроизведением в качестве режима представления для плоскости вторичного видео, PG-плоскости, IG-плоскости или плоскости изображений, сумматор 4226 плоскостей выполняет управление смещением для данных плоскости, принимаемых из декодера 4225 системных целевых объектов. Пара данных плоскости для просмотра левым глазом и данных плоскости для просмотра правым глазом тем самым формируется.
В частности, когда режим 1 плоскости+смещения указывается, сумматор 4226 плоскостей сначала считывает один из идентификаторов 4310-4313 опорного смещения, который соответствует каждой графической плоскости, из SPRM(27) в модуле 4236 хранения переменных проигрывателя. Затем, сумматор 4226 плоскостей обращается к информации смещения, принимаемой из декодера 4225 системных целевых объектов, чтобы извлекать информацию смещения, а именно, направление 1122 смещения и значение 1123 смещения, принадлежащего последовательности 1113 смещений, указываемой посредством каждого идентификатора 4310-4313 опорного смещения. Затем, сумматор 4226 плоскостей считывает одно из значений 4320-4323 регулирования смещения, которое соответствует каждой графической плоскости, из SPRM(28) в модуле 4236 хранения переменных проигрывателя и прибавляет каждое значение регулирования смещения к соответствующему значению смещения. Сумматор 4226 плоскостей затем использует каждое значение смещения, чтобы выполнять управление смещением для соответствующей графической плоскости.
С другой стороны, когда режим 1 плоскости+нулевого смещения указывается, сумматор 4226 плоскостей не обращается к SPRM(27) или SPRM(28), а вместо этого выполняет управление смещением для каждой графической плоскости со значением смещения "0". Соответственно, идентичные данные плоскости используются для графических плоскостей для просмотра левым глазом и правым глазом и комбинируются с другими фрагментами данных плоскости.
Модуль 4227 HDMI-связи, соединенный с дисплейным устройством 103 через HDMI-кабель 122, обменивается CEC-сообщениями с дисплейным устройством 103 через HDMI-кабель 122. Это инструктирует модулю 4227 HDMI-связи выполнять HDMI-аутентификацию дисплейного устройства 103 и запрашивать дисплейное устройство 103 на предмет того, поддерживается или нет воспроизведение трехмерных видеоизображений.
<<Обработка воспроизведения по списку для трехмерного воспроизведения>>
Фиг. 44 является блок-схемой последовательности операций способа обработки воспроизведения по списку для трехмерного воспроизведения посредством модуля 4235 управления воспроизведением. Обработка воспроизведения по списку для трехмерного воспроизведения запускается посредством считывания посредством модуля 4235 управления воспроизведением файла списков для трехмерного воспроизведения из запоминающего устройства 4232 статических сценариев.
На этапе S4401, модуль 4235 управления воспроизведением сначала считывает один PI из основного пути в файле списков для трехмерного воспроизведения и затем задает PI в качестве текущего PL. Затем, из STN-таблицы текущего PI, модуль 4235 управления воспроизведением выбирает PID элементарных потоков, которые должны воспроизводиться, и указывает информацию атрибутов, необходимую для декодирования элементарных потоков. Модуль 4235 управления воспроизведением дополнительно выбирает, из элементарных потоков, соответствующих текущему PI в STN-таблице SS в файле списков для трехмерного воспроизведения, PID элементарных потоков, которые должны добавляться к элементарным потокам, которые должны воспроизводиться, и модуль 4235 управления воспроизведением указывает информацию атрибутов, необходимую для декодирования этих элементарных потоков. Выбранные PID и информация атрибутов указываются в декодер 4225 системных целевых объектов. Модуль 4235 управления воспроизведением дополнительно указывает, из подпутей в файле списков для трехмерного воспроизведения, SUB_PI, к которому следует обращаться одновременно с текущим PI, указывая этот SUB_PI в качестве текущего SUB_PI. После этого, обработка переходит к этапу S4402.
На этапе S4402, модуль 4235 управления воспроизведением выбирает режим отображения для каждого фрагмента данных плоскости на основе смещения в ходе отображения всплывающего меню, указываемого посредством STN-таблицы SS, и указывает режим отображения в декодер 4225 системных целевых объектов и сумматор 4226 плоскостей. В частности, когда значение смещения в ходе отображения всплывающего меню равно "0", режим представления B-D выбирается в качестве режима представления в видеоплоскости, а режим 1 плоскости+смещения выбирается в качестве режима представления для графической плоскости. С другой стороны, когда значение смещения в ходе отображения всплывающего меню равно "1", режим представления B-B выбирается в качестве режима представления в видеоплоскости, а режим 1 плоскости+нулевого смещения выбирается в качестве режима представления для графической плоскости. После этого, обработка переходит к этапу S4403.
На этапе S4403, модуль 4235 управления воспроизведением проверяет то, выбран режим 1 плоскости+смещения или режим 1 плоскости+нулевого смещения в качестве режима представления графической плоскости. Если режим 1 плоскости+смещения выбран, обработка переходит к этапу S4404. Если режим 1 плоскости+нулевого смещения выбран, обработка переходит к этапу S4405.
На этапе S4404, модуль 4235 управления воспроизведением обращается к STN-таблице текущего PI и извлекает PG-поток, IG-поток или поток текстовых субтитров из элементарных потоков, указываемых посредством выбранных PID. Кроме того, модуль 4235 управления воспроизведением указывает идентификатор опорного смещения и значение регулирования смещения, выделяемое фрагментам потоковых данных, задавая идентификатор опорного смещения и значение регулирования смещения для SPRM(27) и SPRM(28) в модуле 4236 хранения переменных проигрывателя. После этого, обработка переходит к этапу S4405.
На этапе S4405, модуль 4235 управления воспроизведением считывает ссылочную информацию о клипах, PTS #1, указывающую время IN1 начала воспроизведения, и PTS #2, указывающую время OUT1 окончания воспроизведения, из текущего PI и SUB_PL. Из этой ссылочной информации о клипах, файл информации о клипах, соответствующий каждому из файла 2D и файла DEP, который должен воспроизводиться, указывается. После этого, обработка переходит к этапу S4406.
На этапе S4406, в отношении карты вхождений в каждом из файлов информации о клипах, указываемых на этапе S4305, модуль 4235 управления воспроизведением извлекает SPN #1 и SPN #2 в файле 2D и SPN #11 и SPN #12 в файле DEP, соответствующие PTS #1 и PTS #2. Как описано со ссылкой на фиг. 24, при обращении к начальным точкам экстентов каждого файла информации о клипах, модуль 4235 управления воспроизведением дополнительно вычисляет, из SPN #1 и SPN #11, число исходных пакетов SPN #21 с начала файла SS до позиции начала воспроизведения. Модуль 4235 управления воспроизведением также вычисляет, из SPN #2 и SPN #12, число исходных пакетов SPN #22 с начала файла SS до позиции окончания воспроизведения. В частности, модуль 4235 управления воспроизведением сначала извлекает, из SPN, показанных посредством начальных точек экстентов файлов информации о двумерных клипах, значение "Am", которое является наибольшим значением, меньшим или равным SPN #1, и извлекает, из SPN, показанных посредством начальных точек экстентов файлов информации о клипах для воспроизведения зависимого вида, значение "Bm", которое является наибольшим значением, меньшим или равным SPN #11. Затем, модуль 4235 управления воспроизведением получает сумму извлеченных SPN Am+Bm и задает сумму как SPN #21. Затем, модуль 4235 управления воспроизведением извлекает, из SPN, показанных посредством начальных точек экстентов файлов информации о двумерных клипах, значение "An", которое является наименьшим значением, которое превышает SPN #2. Модуль 4235 управления воспроизведением также извлекает, из SPN начальных точек экстентов файлов информации о клипах для воспроизведения зависимого вида, значение "Bn", которое является наименьшим значением, которое превышает SPN #12. Затем, модуль 4235 управления воспроизведением получает сумму извлеченных SPN+Bn и задает сумму как SPN #22. После этого, обработка переходит к этапу S4407.
На этапе S4407, модуль 4235 управления воспроизведением преобразует SPN #21 и SPN #22, определенные на этапе S4406, в пару чисел секторов N1 и N2. В частности, модуль 4235 управления воспроизведением сначала получает произведение SPN #21 и объема данных в расчете на исходный пакет, т.е. 192 байта. Затем, модуль 4235 управления воспроизведением делит это произведение на объем данных в расчете на сектор, т.е. 2048 байтов: SPN #21x192/2048. Результирующее частное является идентичным числу секторов N1 с начала файла SS до элемента непосредственно перед позицией начала воспроизведения. Аналогично, из SPN #22, модуль 4235 управления воспроизведением вычисляет SPN #22x192/2048. Результирующее частное является идентичным числу секторов N2 с начала файла SS до элемента непосредственно перед позицией окончания воспроизведения. После этого, обработка переходит к этапу S4408.
На этапе S4408, модуль 4235 управления воспроизведением указывает, из чисел секторов N1 и N2, полученных на этапе S4407, LBN начала и конца группы экстентов SS, которая должна воспроизводиться. В частности, со ссылкой на запись файла для файла SS, который должен воспроизводиться, модуль 4235 управления воспроизведением выполняет подсчет с начала группы секторов, в которую записана группа экстентов SS, так что LBN (N1+1)-го сектора=LBN #1, а LBN (N2+1)-го сектора=LBN #2. Модуль 4235 управления воспроизведением дополнительно указывает диапазон от LBN#1 до LBN#2 в BD-ROM-накопитель 4201. Как результат, из группы секторов в указанном диапазоне, группа исходных пакетов, принадлежащая группе экстентов SS, считывается в совмещенных единицах. После этого, обработка переходит к этапу S4409.
На этапе S4409, при обращении к начальным точкам экстентов файла информации о клипах, используемого на этапе S4406, модуль 4235 управления воспроизведением формирует информацию (в дальнейшем называемую "информацией границы блока данных"), указывающую границу между блоками для воспроизведения зависимого вида и блоками данных для воспроизведения базового вида, включенными в группу экстентов SS, передавая информацию границы блока данных в переключатель 4220. В качестве конкретного примера, допустим, что SPN #21, указывающий позицию начала воспроизведения, является идентичным сумме SPN, указывающих начальные точки экстентов, An+Bn, и что SPN #22, указывающий позицию окончания воспроизведения, является идентичным сумме SPN, указывающих начальные точки экстентов, Am+Bm. В этом случае, модуль 4235 управления воспроизведением получает последовательность разностей между SPN от соответствующих начальных точек экстентов, A(n+1)-An, B(n+1)-Bn, A(n+2)-(n+1), B(n+2)-B(n+1), ..., Am-(m-1) и Bm-B(m-1), и передает последовательность в переключатель 4220 как информацию границы блока данных. Как показано на фиг. 24E, эта последовательность указывает число исходных пакетов блоков данных, включенных в экстент SS. Переключатель 4220 подсчитывает, с нуля, число исходных пакетов экстентов SS, принимаемых из BD-ROM-накопителя 4201. Каждый раз, когда счетчик является идентичным разности между SPN, указываемыми посредством информации границы блока данных, переключатель 4220 переключает назначение вывода исходных пакетов между RB1 4221 и RB2 4222 и сбрасывает счетчик до нуля. Как результат, {B(n+1)-Bn} исходных пакетов с начала экстента SS выводятся в RB2 4222 как первый экстент для воспроизведения зависимого вида, и следующие {A(n+1)-An} исходных пакетов передаются в RB1 4221 как первый экстент для воспроизведения базового вида. После этого, экстенты для воспроизведения зависимого вида и экстенты для воспроизведения базового вида извлекаются из экстента SS поочередно аналогичным образом, чередуясь каждый раз, когда число исходных пакетов, принимаемых посредством переключателя 4220, равно разности между SPN, указываемыми посредством информации границы блока данных.
На этапе S4410, модуль 4235 управления воспроизведением проверяет то, остается или нет необработанный PI в основном пути. Когда необработанный PI остается, обработка повторяется с этапа S4401. Когда необработанных PI не остается, обработка завершается.
<<Декодер системных целевых объектов>>
Следующие два средства являются возможными в качестве конкретного средства, используемого посредством декодера 4225 системных целевых объектов, чтобы реализовывать функцию, чтобы извлекать метаданные смещения из видеопотока для воспроизведения зависимого вида. Первое средство включает фильтр TS-приоритетов и процессор метаданных смещения в декодер 4225 системных целевых объектов в качестве модулей, отдельных от декодера первичного видео. Фильтр TS-приоритетов выбирает TS-пакеты, содержащие метаданные смещения, и TS-пакеты, содержащие изображения для воспроизведения зависимого вида, в зависимости от значений флагов TS-приоритета. Процессор метаданных смещения извлекает информацию смещения из TS-пакетов, содержащих метаданные смещения. Второе средство инструктирует отправку TS-пакетов, содержащих видеопоток для воспроизведения зависимого вида, в декодер первичного видео в декодере 4225 системных целевых объектов независимо от значений флагов TS-приоритета. Декодер первичного видео извлекает информацию смещения из видеопотока для воспроизведения зависимого вида параллельно с процессом декодирования видеопотока для воспроизведения зависимого вида.
Первое средство
Фиг. 45 является функциональной блок-схемой декодера 4225 системных целевых объектов посредством использования первого средства. Компоненты, показанные на фиг. 45, отличаются от компонентов декодера 3724 системных целевых объектов в устройстве двумерного воспроизведения, показанном на фиг. 40, следующим образом: (A) система ввода из буферов считывания в декодеры имеет дуплексную конфигурацию; и (B) фильтр TS-приоритетов и процессор метаданных смещения предоставляются. Декодер первичного аудио, декодер вторичного аудио, аудиомикшер, процессор изображений и запоминающие устройства плоскостей имеют структуры, аналогичные структурам в устройстве двумерного воспроизведения, показанном на фиг. 40. Соответственно, из компонентов, показанных на фиг. 45, компоненты, отличающиеся от компонентов, показанных на фиг. 40, описываются ниже. С другой стороны, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 40. Кроме того, поскольку видеодекодеры имеют аналогичную структуру, структура декодера 4515 первичного видео описывается ниже. Это описание также является допустимым для структур других видеодекодеров.
Первый модуль 4511 депакетирования источников считывает исходные пакеты из первого буфера 4221 считывания. Первый модуль 4511 депакетирования источников дополнительно извлекает TS-пакеты, включенные в исходные пакеты, и передает TS-пакеты в первый PID-фильтр 4513. Второй модуль 4512 депакетирования источников считывает исходные пакеты из второго буфера 4222 считывания, помимо этого, извлекая TS-пакеты, включенные в исходные пакеты, и передавая TS-пакеты во второй PID-фильтр 4514. Каждый из модулей 4511 и 4512 депакетирования источников дополнительно синхронизирует время передачи TS-пакеты со временем, показанным посредством ATS каждого исходного пакета. Этот способ синхронизации является идентичным способу в модуле 4010 депакетирования источников, показанном на фиг. 40. Соответственно, его подробности могут быть обнаружены в описании, предоставленном на фиг. 40. При таком типе регулирования времени передачи, средняя скорость передачи TS-пакетов из первого модуля 4511 депакетирования источников в первый PID-фильтр 4513 не превышает системную скорость RTS1, указываемую посредством файла информации о двумерных клипах. Аналогично, средняя скорость передачи TS-пакетов из второго модуля 4512 депакетирования источников во второй PID-фильтр 4514 не превышает системную скорость RTS2, указываемую посредством файла информации о клипах для воспроизведения зависимого вида.
Первый PID-фильтр 4513 сравнивает PID каждого TS-пакета, принимаемого из первого модуля 4511 депакетирования источников, с выбранным PID. Модуль 4235 управления воспроизведением обозначает выбранный PID заранее в соответствии с STN-таблицей в файле списков для трехмерного воспроизведения. Когда два PID совпадают, первый PID-фильтр 4513 передает TS-пакеты в декодер, назначенный для PID. Например, если PID равен 0x1011, TS-пакеты передаются в TB1 4501 в декодере 4515 первичного видео. С другой стороны, TS-пакеты с PID в рамках 0x1B00-0x1B1F, 0x1100-0x111F, 0x1A00-0x1A1F, 0x1200-0x121F и 0x1400-0x141F передаются в декодер вторичного видео, декодер первичного аудио, декодер вторичного аудио, PG-декодер и IG-декодер, соответственно.
Второй PID-фильтр 4514 сравнивает PID каждого TS-пакета, принимаемого из второго модуля 4512 депакетирования источников, с выбранным PID. Модуль 4235 управления воспроизведением обозначает выбранный PID заранее в соответствии с STN-таблицей SS в файле списков для трехмерного воспроизведения. Когда два PID совпадают, второй PID-фильтр 4514 передает TS-пакеты в декодер, назначенный для PID, или в фильтр 4551 TS-приоритетов. Например, если PID равен 0x1012 или 0x1013, TS-пакеты передаются в фильтр 4551 TS-приоритетов. С другой стороны, TS-пакеты с PID в рамках от 0x1B20-0x1B3F, 0x1220-0x127F и 0x1420-0x147F передаются в декодер вторичного видео, PG-декодер и IG-декодер, соответственно.
Фильтр 4551 TS-приоритетов принимает TS-пакеты из второго PID-фильтра 4514 и считывает TS-приоритет 511 из TS-заголовка 501H в каждом из TS-пакетов. Здесь, TS-пакеты с PID=0x1012 или 0x1013 передаются из второго PID-фильтра 4514 в фильтр 4551 TS-приоритетов. Эти TS-пакеты содержат видеопоток для воспроизведения зависимого вида.
Из TS-пакетов в последовательности 1520, показанной на фиг. 15, первая группа 1521 и третья группа 1523 имеют TS-приоритет "0", а вторая группа 1522 имеет TS-приоритет "1". Фильтр 4551 TS-приоритетов передает TS-пакеты с TS-приоритетом=0 из последовательности 1520 в TB2 4508 в декодере 4515 первичного видео и TS-пакеты с TS-приоритетом=1 в процессор 4552 метаданных смещения. Как показано на фиг. 15, TS-пакеты с TS-приоритетом=1 принадлежат второй группе 1522. Соответственно, их рабочие TS-данные включают в себя только дополнительные данные 1504, состоящие только из метаданных 1509 смещения. Как результат, из VAU #1 в видеопотоке для воспроизведения зависимого вида, дополнительные данные, состоящие только из метаданных 1509 смещения, передаются в процессор 4552 метаданных смещения, а оставшиеся данные, которые включают в себя другие дополнительные данные, передаются в декодер 4515 первичного видео.
Из TS-пакетов в последовательности 1620, показанной на фиг. 16, первая группа 1621 и вторая группа 1622 имеют TS-приоритет "1", а третья группа 1623 имеет TS-приоритет "0". Фильтр 4551 TS-приоритетов передает TS-пакеты с TS-приоритетом=0 из последовательности 1620 в TB2 4508 в декодере 4515 первичного видео и TS-пакеты с TS-приоритетом=1 как в TB2 4508, так и в процессор 4552 метаданных смещения. Соответственно, VAU #1 в видеопотоке для воспроизведения зависимого вида передается в декодер 4515 первичного видео, при этом элементы от идентификационного кода суб-AU до дополнительных данных передаются также и в процессор 4552 метаданных смещения.
Декодер 4515 первичного видео включает в себя TB1 4501, MB1 4502, EB1 4503, TB2 4508, MB2 4509, EB2 4510, переключатель 4506 буферов, DEC 4504, DPB 4505 и переключатель 4507 изображений. TB1 4501, MB1 4502, EB1 4503, TB2 4508, MB2 4509, EB2 4510 и DPB 4505 являются буферными запоминающими устройствами. Каждое из этих буферных запоминающих устройств использует область запоминающего элемента, включенного в декодер 4515 первичного видео. Альтернативно, некоторые или все эти буферные запоминающие устройства могут разделяться на различные запоминающие элементы.
TB1 4501 принимает TS-пакеты, которые включают в себя видеопоток для воспроизведения базового вида, из первого PID-фильтра 4513 и сохраняет TS-пакеты как есть. MB1 4502 сохраняет PES-пакеты, восстановленные из TS-пакетов, сохраненных в TB1 4501. TS-заголовки TS-пакетов удаляются на этой стадии. EB1 4503 извлекает и сохраняет кодированные VAU из PES-пакетов, сохраненных в MB1 4502. PES-заголовки PES-пакетов удаляются на этой стадии.
TB2 4508 принимает TS-пакеты, которые включают в себя видеопоток для воспроизведения зависимого вида, из фильтра 4551 TS-приоритетов и сохраняет TS-пакеты как есть. MB2 4509 сохраняет PES-пакеты, восстановленные из TS-пакетов, сохраненных в TB2 4508. TS-заголовки TS-пакетов удаляются на этой стадии. EB2 4510 извлекает и сохраняет кодированные VAU из PES-пакетов, сохраненных в MB2 4509. PES-заголовки PES-пакетов удаляются на этой стадии.
Переключатель 4506 буферов передает заголовки VAU, сохраненных в EB1 4503 и EB2 4510, в ответ на запрос из DEC 4504. Кроме того, переключатель 4506 буферов передает данные сжатых изображений для VAU в DEC 4504 во времена, указываемые посредством DTS, включенных в исходные PES-пакеты. В этом случае, DTS равны между парой изображений, принадлежащих одной трехмерной VAU между видеопотоком для воспроизведения базового вида и видеопотоком для воспроизведения зависимого вида. Соответственно, для пары VAU, которые имеют идентичную DTS, переключатель 4506 буферов сначала передает VAU, сохраненную в EB1 4503, в DEC 4504. Дополнительно, переключатель 4506 буферов может инструктировать DEC 4504 возвращать информацию 1750 переключения декодирования в VAU. В таком случае, переключатель 4506 буферов может определять то, должен он или нет передавать следующую VAU из EB1 4503 или EB2 4510, посредством обращения к информации 1750 переключения декодирования.
Аналогично DEC 4004, показанному на фиг. 40, DEC 4504 является аппаратным декодером специально для декодирования сжатых изображений и состоит из LSI, которая включает в себя, в частности, функцию, чтобы ускорять декодирование. DEC 4504 декодирует данные сжатых изображений, передаваемые из переключателя 4506 буферов, по порядку. Во время декодирования DEC 4504 сначала анализирует каждый заголовок VAU, чтобы указывать сжатое изображение, способ кодирования со сжатием и атрибут потока, сохраненные в VAU, выбирая способ декодирования в соответствии с этой информацией. Способы кодирования со сжатием включают в себя, например, MPEG-2, MPEG-4 AVC, MVC и VC1. Кроме того, DEC 4504 передает декодированное несжатое изображение в DPB 4505.
DPB 4505 временно сохраняет несжатые изображения, декодированные посредством DEC 4504. Когда DEC 4504 декодирует P-изображение или B-изображение, DPB 4505 извлекает опорные изображения из сохраненных несжатых изображений в ответ на запрос из DEC 4504 и предоставляет извлеченные опорные изображения в DEC 4504.
Переключатель 4507 изображений записывает несжатые изображения из DPB 4505 либо в запоминающее устройство 4520 левой видеоплоскости, либо в запоминающее устройство 4521 правой видеоплоскости во время, указанное посредством PTS, включенной в исходный PES-пакет. В этом случае, PTS равны между изображением для воспроизведения базового вида и изображением для воспроизведения зависимого вида, принадлежащим одной трехмерной VAU. Соответственно, для пары изображений, которые имеют идентичную PTS и которые сохраняются посредством DPB 4505, переключатель 4507 изображений сначала записывает изображение для воспроизведения базового вида в запоминающее устройство 4520 левой видеоплоскости, и затем записывает изображение для воспроизведения зависимого вида в запоминающее устройство 4521 правой видеоплоскости.
Процессор 4552 метаданных смещения реализован на микросхеме, идентичной микросхеме декодера 4515 первичного видео, но выполнен в качестве модуля, отдельного от декодера 4515 первичного видео. Альтернативно, процессор 4552 метаданных смещения может быть реализован на микросхеме, отдельной от микросхемы, на которой реализован декодер 4515 первичного видео. Кроме того, процессор 4552 метаданных смещения может быть выполнен как специализированные аппаратные средства или реализован как аппаратные средства общего назначения, управляемые посредством программного обеспечения. Процессор 4552 метаданных смещения анализирует TS-пакеты, передаваемые из фильтра 4551 TS-приоритетов, и затем считывает метаданные смещения из дополнительных данных, сохраненных в рабочих TS-данных TS-пакетов.
Последовательность 1520 TS-пакетов, показанная на фиг. 15, содержит PES-заголовок, принадлежащий PES-пакету, идентичному VAU #1 в группе TS-пакетов, которые должны быть переданы в декодер 4515 первичного видео. Соответственно, процессор 4552 метаданных смещения считывает PTS кадра, представленного посредством VAU #1, из метаданных смещения. С другой стороны, последовательность TS-пакетов 1620, показанная на фиг. 16, содержит PES-заголовок в группе TS-пакетов, которые должны быть переданы в процессор 4552 метаданных смещения, а также в группе TS-пакетов, которые должны быть переданы в декодер 4515 первичного видео. Соответственно, процессор 4552 метаданных смещения может считывать PTS кадра, представленного посредством VAU #1, из PES-заголовка и метаданных смещения.
Процессор 4552 метаданных смещения увеличивает номер кадра на 1 в интервалах кадра с началом в 0 во время, указанное посредством PTS. Синхронно с действием увеличения процессор 4552 метаданных смещения дополнительно извлекает информацию смещения, ассоциированную с каждым номером кадра, из метаданных смещения и затем передает информацию смещения в сумматор 4226 плоскостей. Здесь, фильтр 4551 TS-приоритетов не допускает передачи данных сжатых изображений из любой из последовательностей 1520 и 1620 TS-пакетов, показанных на фиг. 15 и 16, в процессор 4552 метаданных смещения. Соответственно, процессор 4552 метаданных смещения может достоверно управлять информацией смещения без помех от данных сжатых изображений.
Второе средство
Фиг. 46 является функциональной блок-схемой, показывающей систему для обработки видеопотоков, причем система включена в декодер 4225 системных целевых объектов, который использует второе средство. Декодер 4225 системных целевых объектов, показанный на фиг. 46, отличается от декодера, показанного на фиг. 45, функцией DEC 4604 в декодере 4614 первичного видео. Другие компоненты являются аналогичными соответствующим компонентам. На фиг. 46, компоненты, аналогичные компонентам, показанным на фиг. 45, отмечены с помощью идентичных ссылок с номерами. Кроме того, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 45.
Аналогично DEC 4504, показанному на фиг. 45, DEC 4604 является аппаратным декодером специально для декодирования сжатых изображений и состоит из LSI, которая включает в себя, в частности, функцию, чтобы ускорять декодирование. DEC 4604 декодирует данные сжатых изображений, передаваемые из переключателя 4506 буферов, по порядку и передает декодированные несжатые изображения в DPB 4505. Кроме того, каждый раз, когда он считывает VAU, расположенную в начале каждой видеопоследовательности, из видеопотока для воспроизведения зависимого вида, DEC 4604 считывает метаданные смещения из VAU. В секции воспроизведения видеопоследовательности DEC 4604 сначала идентифицирует PTS, которая сохраняется в одном PES-пакете с VAU, и номер кадра, представленный посредством данных сжатых изображений VAU. DEC 4604 считывает информацию смещения, ассоциированную с номером кадра, из метаданных смещения и отправляет информацию смещения в сумматор 4226 плоскостей во время, указываемое посредством идентифицированной PTS.
<<Сумматоры плоскостей>>
Фиг. 47 является функциональной блок-схемой сумматора 4226 плоскостей. Как показано на фиг. 47, сумматор 4226 плоскостей включает в себя модуль 4710 формирования параллактического видео, переключатель 4720, четыре модуля 4731-4734 кадрирования и четыре сумматора 4741-4744.
Модуль 4710 формирования параллактического видео принимает данные 4701 левой видеоплоскости и данные 4702 правой видеоплоскости из декодера 4225 системных целевых объектов. В устройстве 102 воспроизведения в L/R-режиме, данные 4701 левой видеоплоскости представляют видеоплоскость для просмотра левым глазом, а данные 4702 правой видеоплоскости представляют видеоплоскость для просмотра правым глазом. Здесь, модуль 4710 формирования параллактического видео передает данные 4701 левой видеоплоскости и данные 4702 правой видеоплоскости как есть в переключатель 4720. С другой стороны, в устройстве 102 воспроизведения в режиме глубины, данные 4701 левой видеоплоскости представляют видеоплоскость для двумерных видеоизображений, а данные 4702 правой видеоплоскости представляют карту глубины для двумерных видеоизображений. В этом случае, модуль 4710 формирования параллактического видео сначала вычисляет бинокулярный параллакс для каждого элемента в двумерных видеоизображениях с использованием карты глубины. Затем, модуль 4710 формирования параллактического видео обрабатывает данные 4701 левой видеоплоскости, чтобы сдвигать позицию представления каждого элемента в видеоплоскости для двумерных видеоизображений влево или вправо согласно вычисленному бинокулярному параллаксу. Это формирует пару видеоплоскостей, представляющую вид для просмотра левым глазом и вид для просмотра правым глазом. Более того, модуль 4710 формирования параллактического видео передает пару видеоплоскостей в переключатель 4720 как пару фрагментов данных левой видео- и правой видеоплоскости.
Когда модуль 4235 управления воспроизведением указывает режим представления B-D, переключатель 4720 передает данные 4701 левой видеоплоскости и данные 4702 правой видеоплоскости с одинаковой PTS в первый сумматор 4741 в данном порядке. Когда модуль 4235 управления воспроизведением указывает режим представления B-B, переключатель 4720 передает одно из данных 4701 левой видеоплоскости и данных 4702 правой видеоплоскости с одинаковой PTS два раза в расчете на каждый кадр в первый сумматор 4741, отбрасывая другой фрагмент данных плоскости.
Первый модуль 4731 кадрирования включает в себя структуру, идентичную структуре пары из модуля 4710 формирования параллактического видео и переключателя 4720. Эти структуры используются, когда данные плоскости вторичного видео являются парой из вида для просмотра левым глазом и вида для просмотра правым глазом. В частности, в устройстве 102 воспроизведения в режиме глубины, модуль формирования параллактического видео в первом модуле 4731 кадрирования преобразует данные плоскости вторичного видео в пару фрагментов для просмотра левым глазом и правым глазом для данных плоскости. Когда модуль 4235 управления воспроизведением указывает режим представления B-D, фрагменты для просмотра левым глазом и правым глазом для данных плоскости поочередно передаются в первый сумматор 4741. С другой стороны, когда модуль 4235 управления воспроизведением указывает режим представления B-B, один из фрагментов для просмотра левым глазом и правым глазом для данных плоскости передается два раза в расчете на каждый кадр в первый сумматор 4741, а другой фрагмент данных плоскости отбрасывается.
Когда модуль 4235 управления воспроизведением указывает режим 1 плоскости+смещения, первый модуль 4731 кадрирования выполняет следующее управление смещением для данных 4703 плоскости вторичного видео. Первый модуль 4731 кадрирования сначала принимает информацию 4707 смещения из декодера 4225 системных целевых объектов. Здесь, первый модуль 4731 кадрирования считывает идентификатор 4212 опорного смещения (SV_ref_offset_id), соответствующий плоскости вторичного видео, из SPRM(27) 4751 в модуле 4236 хранения переменных проигрывателя. Затем, первый модуль 4731 кадрирования извлекает информацию смещения, принадлежащую последовательности смещений, указываемой посредством идентификатора опорного смещения, из информации 4707 смещения, принимаемой из декодера 4225 системных целевых объектов. Затем, первый модуль 4731 кадрирования считывает значение 4222 регулирования смещения (SV_offset_adjustment), соответствующее плоскости вторичного видео, из SPRM(28) 4752 в модуле 4236 хранения переменных проигрывателя и прибавляет значение регулирования смещения к извлеченному значению смещения. После этого первый модуль 4731 кадрирования обращается к значению смещения, чтобы выполнять управление смещением для данных 4703 плоскости вторичного видео. Как результат, данные 4703 плоскости вторичного видео преобразуются в пару фрагментов данных плоскости вторичного видео, представляющих вид для просмотра левым глазом и вид для просмотра правым глазом, и эта пара поочередно выводится.
Модуль 4235 управления воспроизведением, в общем, обновляет значения SPRM(27) 4751 и SPRM(28) 4752 каждый раз, когда текущий PI изменяется. Дополнительно, модуль 4234 выполнения программ может устанавливать значения SPRM(27) 4751 и SPRM(28) 4752 в соответствии с кинообъектом или BD-J-объектом.
С другой стороны, когда модуль 4235 управления воспроизведением указывает режим 1 плоскости+нулевого смещения, первый модуль 4731 кадрирования не выполняет управление смещением, вместо этого выводя данные 4703 плоскости вторичного видео два раза как есть.
Аналогично, второй модуль 4732 кадрирования обращается к идентификатору 4310 опорного смещения (PG_ref_offset_id) для PG-плоскости и к значению 4320 регулирования смещения (PG_offset_adjustment), чтобы выполнять управление смещением для данных 4704 PG-плоскости. Третий модуль 4733 кадрирования обращается к идентификатору 4311 опорного смещения (IG_ref_offset_id) для IG-плоскости и к значению 4321 регулирования смещения (IG_offset_adjustment), чтобы выполнять управление смещением для данных 4705 IG-плоскости. Первый модуль 4734 кадрирования обращается к идентификатору 4213 опорного смещения (IM_ref_offset_id) для плоскости изображений и к значению 4323 регулирования смещения (IM_offset_adjustment), чтобы выполнять управление смещением для данных 4706 плоскости изображений.
[Блок-схема последовательности операций способа управления смещением]
Фиг. 48 является блок-схемой последовательности операций способа управления смещением посредством модулей 4731-4734 кадрирования. Каждый из модулей 4731-4734 кадрирования начинает управление смещением при приеме информации 4707 смещения из декодера 4225 системных целевых объектов. В следующем примере, второй модуль 4732 кадрирования выполняет управление смещением для данных 4704 PG-плоскости. Другие модули 4731, 4733 и 4734 кадрирования выполняют аналогичную обработку, соответственно, для данных 4703 плоскости вторичного видео, данных 4705 IG-плоскости и данных 4706 плоскости изображений.
На этапе S4801, второй модуль 4732 кадрирования сначала принимает данные 4704 PG-плоскости из декодера 4225 системных целевых объектов. Здесь, второй модуль 4732 кадрирования считывает идентификатор 4310 опорного смещения (PG_ref_offset_id) для PG-плоскости из SPRM(27) 4751. Затем, второй модуль 4731 кадрирования извлекает информацию смещения, принадлежащую последовательности смещений, указываемой посредством идентификатора опорного смещения, из информации 4707 смещения, принимаемой из декодера 4225 системных целевых объектов. После этого, обработка переходит к этапу S4802.
На этапе S4802, второй модуль 4732 кадрирования считывает значение 4320 регулирования смещения (PG_offset_adjustment) для PG-плоскости из SPRM(28) 4752 и прибавляет это значение регулирования смещения к значению смещения, извлеченному на этапе S4801. После этого, обработка переходит к этапу S4803.
На этапе S4803, второй модуль 4732 кадрирования проверяет то, какой из вида для просмотра левым глазом и вида для просмотра правым глазом представляется посредством данных видеоплоскости, выбранных посредством переключателя 4720. Если данные видеоплоскости представляют вид для просмотра левым глазом, обработка переходит к этапу S4804. Если данные видеоплоскости представляют вид для просмотра правым глазом, обработка переходит к этапу S4807.
На этапе S4804, второй модуль 4732 кадрирования проверяет значение извлеченного направления смещения. В дальнейшем в этом документе, допускается следующее: если значение направления смещения равно "0", трехмерное графическое изображение ближе к зрителю, чем экран, а если значение направления смещения равно "1", изображение дальше экрана. В этом контексте, когда значение направления смещения равно "0", обработка переходит к этапу S4805. Если значение направления смещения равно "1", обработка переходит к этапу S4806.
На этапе S4805, второй модуль 4732 кадрирования предоставляет смещение вправо в данные 4704 PG-плоскости. Другими словами, позиция каждого фрагмента пикселных данных, включенных в данные 4704 PG-плоскости, сдвигается вправо на значение смещения. После этого, обработка переходит к этапу S4810.
На этапе S4806, второй модуль 4732 кадрирования предоставляет смещение влево в данные 4704 PG-плоскости. Другими словами, позиция каждого фрагмента пикселных данных, включенных в данные 4704 PG-плоскости, сдвигается влево на значение смещения. После этого, обработка переходит к этапу S4810.
На этапе S4807, второй модуль 4732 кадрирования проверяет значение извлеченного направления смещения. Если значение направления смещения равно "0", обработка переходит к этапу S4808. Если значение направления смещения равно "1", обработка переходит к этапу S4809.
На этапе S4808, второй модуль 4732 кадрирования предоставляет смещение влево в данные 4704 PG-плоскости, в отличие от этапа S4805. Другими словами, позиция каждого фрагмента пикселных данных, включенных в данные 4704 PG-плоскости, сдвигается влево на значение смещения. После этого, обработка переходит к этапу S4810.
На этапе S4809, второй модуль 4732 кадрирования предоставляет смещение вправо в данные 4704 PG-плоскости, в отличие от этапа S4806. Другими словами, позиция каждого фрагмента пикселных данных, включенных в данные 4704 PG-плоскости, сдвигается вправо на значение смещения.
После этого, обработка переходит к этапу S4810.
На этапе S4810, второй модуль 4732 кадрирования выводит обработанные данные 4704 PG-плоскости в третий модуль 4734 кадрирования. Обработка затем завершается.
[Изменения данных плоскости через управление смещением]
Фиг. 49B является принципиальной схемой, показывающей данные GP PG-плоскости, для которых второй модуль 4732 кадрирования должен предоставлять управление смещением. Как показано на фиг. 49B, данные GP PG-плоскости включают в себя пикселные данные, представляющие субтитр "Я люблю тебя", т.е. данные STL субтитров. Эти данные STL субтитров находятся на расстоянии DO от левого края данных GP PG-плоскости.
Фиг. 49A является принципиальной схемой, показывающей данные RPG PG-плоскости, для которых предоставлено смещение вправо. Как показано на фиг. 49A, при предоставлении смещения вправо в данные GP PG-плоскости, второй модуль 4732 кадрирования изменяет позицию каждого фрагмента пикселных данных в данных GP PG-плоскости от исходной позиции вправо на число пикселов OFS, равное значению смещения. В частности, второй модуль 4732 кадрирования выполняет кадрирование, чтобы удалять, из правого края данных GP PG-плоскости, пикселные данные, включенные в полосу AR1 ширины OFS, равной значению смещения. Затем, второй модуль 4732 кадрирования формирует полосу AL1 ширины OFS посредством добавления пикселных данных к левому краю данных GP PG-плоскости. Пикселные данные, включенные в эту полосу AL1, заданы как прозрачные. Этот процесс дает в результате данные RGP PG-плоскости, для которых предоставлено смещение вправо. Данные STL субтитров фактически находятся на расстоянии DR от левого края этих данных RGP PG-плоскости. Это расстояние DR равно исходному расстоянию DO плюс значение OFS смещения: DR=DO+OFS.
Фиг. 49C является принципиальной схемой, показывающей данные LPG PG-плоскости, для которых предоставлено смещение влево. Как показано на фиг. 49C, при предоставлении смещения влево в данные GP PG-плоскости, второй модуль 4732 кадрирования изменяет позицию каждого фрагмента пикселных данных в данных GP PG-плоскости от исходной позиции влево на число пикселов OFS, равное значению смещения. В частности, второй модуль 4732 кадрирования выполняет кадрирование, чтобы удалять, из левого края данных GP PG-плоскости, пикселные данные, включенные в полосу AL2 ширины OFS, равной значению смещения. Затем, второй модуль 4732 кадрирования формирует полосу AR2 ширины OFS посредством добавления пикселных данных к правому краю данных GP PG-плоскости. Пикселные данные, включенные в эту полосу AR2, заданы как прозрачные. Этот процесс дает в результате данные LGP PG-плоскости, для которых предоставлено смещение влево. Данные STL субтитров фактически находятся на расстоянии DL от левого края этих данных RGP PG-плоскости. Это расстояние DL равно исходному расстоянию DO минус значение OFS смещения: DL=DO-OFS.
Снова ссылаясь на фиг. 47, первый сумматор 4741 принимает данные видеоплоскости из переключателя 4720 и принимает данные плоскости вторичного видео из первого модуля 4731 кадрирования. Здесь, первый сумматор 4741 накладывает каждую пару из данных плоскости и данных плоскости вторичного видео и передает результат во второй сумматор 4742. Второй сумматор 4742 принимает данные PG-плоскости из второго модуля 4732 кадрирования, накладывает эти данные PG-плоскости на данные плоскости из первого сумматора 4741 и передает результат в третий сумматор 4743. Третий сумматор 4743 принимает данные IG-плоскости из третьего модуля 4733 кадрирования, накладывает эти данные IG-плоскости на данные плоскости из второго сумматора 4742 и передает результат в четвертый сумматор 4744. Четвертый сумматор 4744 принимает данные плоскости изображений из четвертого модуля 4734 кадрирования, накладывает эти данные плоскости изображений на данные плоскости из третьего сумматора 4743 и выводит результат на дисплейное устройство 103. Сумматоры 4741-4744 используют альфа-сопряжение при наложении данных плоскости. Таким образом, данные 4703 плоскости вторичного видео, данные 4704 PG-плоскости, данные 4705 IG-плоскости и данные 4706 плоскости изображений накладываются в порядке, показанном посредством стрелки 4700 на фиг. 47, на данные 4701 левой видеоплоскости или данные 4702 правой видеоплоскости. Как результат, видеоизображения, указываемые посредством каждого фрагмента данных плоскости, отображаются на экране дисплейного устройства 103 так, что левая или правая видеоплоскость кажется перекрывающейся с плоскостью вторичного видео, IG-плоскостью, PG-плоскостью и плоскостью изображений в этом порядке.
В дополнение к вышеуказанной обработке, сумматор 4724 плоскостей преобразует формат вывода данных плоскости, комбинированных посредством четырех сумматоров 4741-4744, в формат, который соответствует способу отображения трехмерных видеоизображений, приспосабливаемому в устройстве, таком как дисплейное устройство 103, на которое выводятся данные. Если способ поочередной последовательности кадров приспосабливается в устройстве, например, сумматор 4724 плоскостей выводит фрагменты составных данных плоскости как один кадр или одно поле. С другой стороны, если способ, который использует ступенчатую линзу, приспосабливается в устройстве, сумматор 4724 плоскостей комбинирует пару фрагментов для просмотра левым глазом и правым глазом для данных плоскости как один кадр или одно поле видеоданных с использованием внутреннего буферного запоминающего устройства. В частности, сумматор 4724 плоскостей временно сохраняет и хранит в буферном запоминающем устройстве данные плоскости для просмотра левым глазом, которые комбинированы первыми. Затем, сумматор 4724 плоскостей комбинирует данные плоскости для просмотра правым глазом и дополнительно комбинирует полученные в результате данные с данными плоскости для просмотра левым глазом, хранимыми в буферном запоминающем устройстве. В ходе комбинирования фрагменты для просмотра левым глазом и правым глазом для данных плоскости делятся, в вертикальном направлении, на небольшие прямоугольные области, которые являются длинными и тонкими, и небольшие прямоугольные области размещаются поочередно в горизонтальном направлении в одном кадре или одном поле, чтобы воссоздавать кадр или поле. Таким образом, пара фрагментов для просмотра левым глазом и правым глазом для данных плоскости комбинируется в один видеокадр или поле. Сумматор 4724 плоскостей затем выводит комбинированный видеокадр или поле в соответствующее устройство.
<Эффекты варианта осуществления 1>
В BD-ROM-диске 101 согласно варианту осуществления 1 настоящего изобретения, как показано на фиг. 15 и 16, TS-приоритеты назначаются последовательности TS-пакетов, которая сохраняет VAU в начале каждой видеопоследовательности, составляющей видеопоток для воспроизведения зависимого вида. В частности, различные TS-приоритеты назначаются группе TS-пакетов, сохраняющей метаданные смещения, и группе TS-пакетов, сохраняющей данные сжатых изображений. В этом случае, функция, чтобы извлекать метаданные смещения, может быть реализована в декодере 4225 системных целевых объектов посредством первого средства, показанного на фиг. 45, или второго средства, показанного на фиг. 46. Декодер 4225 системных целевых объектов посредством первого средства может легко отсортировывать TS-пакеты, сохраняющие метаданные смещения, от других посредством использования TS-приоритетов. Соответственно, декодер 4515 первичного видео и процессор 4552 метаданных смещения могут быть реализованы в различных формах. В частности, даже если декодер 4515 первичного видео состоит из аппаратных средств, независимо от этого процессор 4552 метаданных смещения может состоять из специализированных аппаратных средств или быть реализован посредством программного обеспечения с использованием аппаратных средств общего назначения. С другой стороны, в декодере 4225 системных целевых объектов посредством второго средства, декодер 4615 первичного видео может выполнять параллельно как функцию, чтобы декодировать видеопоток для воспроизведения зависимого вида, так и функцию, чтобы извлекать метаданные смещения. Таким образом, независимо от TS-приоритетов все TS-пакеты, сохраняющие видеопоток для воспроизведения зависимого вида, могут передаваться в декодер 4615 первичного видео. Таким образом, структура данных видеопотока для воспроизведения зависимого вида и метаданных смещения, записанных на BD-ROM-диске 101 согласно варианту осуществления 1 настоящего изобретения, может использоваться совместно посредством декодера 4225 системных целевых объектов, реализованного посредством первого средства, и декодера 4225 системных целевых объектов, реализованного посредством второго средства.
<Модификации>
(1-A) Видеопоток
(1-A) В L/R-режиме согласно варианту осуществления 1 настоящего изобретения, видеопоток для воспроизведения базового вида представляет вид для просмотра левым глазом, и видеопоток для воспроизведения зависимого вида представляет вид для просмотра правым глазом. В отличие от этого, тем не менее, видеопоток для воспроизведения базового вида может представлять вид для просмотра правым глазом, а видеопоток для воспроизведения зависимого вида - вид для просмотра левым глазом.
На BD-ROM-диске 101 согласно варианту осуществления 1 настоящего изобретения, видеопоток для воспроизведения базового вида и видеопоток для воспроизведения зависимого вида мультиплексируются в различных TS. Альтернативно, видеопоток для воспроизведения базового вида и видеопоток для воспроизведения зависимого вида могут быть мультиплексированы в один TS.
(1-B) Метаданные смещения
(1-B-1) Метаданные смещения могут сохраняться в видеопотоке для воспроизведения базового вида вместо видеопотока для воспроизведения зависимого вида. В этом случае также, метаданные смещения предпочтительно сохраняются в дополнительных данных в VAU, расположенной в начале каждой видеопоследовательности. Кроме того, файл списков для трехмерного воспроизведения может содержать флаг, указывающий то, включает или нет видеопоток для воспроизведения базового вида или видеопоток для воспроизведения зависимого вида в себя метаданные смещения. Это предоставляет возможность увеличения степени свободы при создании каждого фрагмента потоковых данных. Кроме того, может быть предписано то, что запрещено изменение этого флага во время между PI, в которых видеоизображения плавно соединяются через CC=5, 6.
(1-B-2) Метаданные смещения могут сохраняться в каждой VAU (т.е. каждом кадре или поле) вместо сохранения только в первой VAU в каждой видеопоследовательности (т.е. каждой GOP). Альтернативно, метаданные смещения могут задаваться со случайным интервалами, к примеру, в три кадра или более, для каждого содержимого. В этом случае, предпочтительно, чтобы метаданные смещения всегда сохранялись в первой VAU в каждой видеопоследовательности, а интервал между метаданными смещения и непосредственно предшествующими метаданными смещения был ограничен как равный или больший трех кадров. Соответственно, устройство воспроизведения может надежно выполнять обработку, чтобы изменять информацию смещения параллельно с воспроизведением с прерываниями.
(1-B-3) Вместо сохранения в видеопотоке, метаданные смещения могут быть мультиплексированы в основном TS или суб-TS как независимые потоковые данные. В этом случае, уникальный PID выделяется метаданным смещения. Декодер системных целевых объектов обращается к этому PID, чтобы отделять метаданные смещения от других потоковых данных. Альтернативно, метаданные смещения могут сначала предварительно загружаться в выделенный буфер и позднее подвергаться обработке воспроизведения, аналогично потоку текстовых субтитров. В этом случае, метаданные смещения сохраняются с постоянными межкадровыми интервалами. Соответственно, PTS не требуется для метаданных смещения, тем самым уменьшая объем данных PES-заголовка. Это уменьшает емкость буфера для предварительной загрузки.
(1-B-4) Вместо сохранения в дополнительных данных VAU, метаданные смещения могут встраиваться в видеопоток с использованием водяного видеознака. Кроме того, метаданные смещения могут встраиваться в аудиопоток с использованием водяного аудиознака.
(1-B-5) В суб-TS согласно варианту осуществления 1 настоящего изобретения, как показано на фиг. 15, TS-пакеты 1530 и 1550, расположенные в концах первой группы 1521 и второй группы 1522, соответственно, в общем, включают в себя AD-поля 1532 и 1552. При такой структуре, три группы 1521-1523 являются отдельными друг от друга. Альтернативно, в VAU #1 1500 в видеопотоке для воспроизведения зависимого вида, размер дополняющих данных 1506 может регулироваться так, что три группы 1521-1523 являются отдельными друг от друга.
(1-B-6) TS-пакеты, содержащие метаданные смещения, могут выбираться в декодере системных целевых объектов в зависимости от PID, вместо TS-приоритета. Фиг. 50 является принципиальной схемой, показывающей PES-пакет 5010, содержащий VAU #1 5000 в видеопотоке для воспроизведения зависимого вида, и последовательности 5020 TS-пакетов, сформированных из PES-пакета 5010.
VAU #1 5000 располагается в начале видеопоследовательности и, соответственно, включает в себя дополнительные данные 5004, состоящие только из метаданных 5009 смещения. Рабочие PES-данные 5012 PES-пакета 5010 содержат VAU #1 5000, и их PES-заголовок 5011 включает DTS и PTS, назначенные данным 5005 сжатых изображений, в VAU #1 5000. PES-пакет 5010 сохраняется в последовательности 5020 TS-пакетов в порядке с начала. В этой компоновке, последовательность 5020 TS-пакетов разделяется на три группы 5021, 5022 и 5023 в порядке с начала. Первая группа 5021 включает в себя PES-заголовок 5011, идентификационный код 5001 суб-AU, заголовок 5002 подпоследовательности и заголовок 5003 изображения. Вторая группа 5022 включает в себя дополнительные данные 5004, состоящие только из метаданных 5009 смещения. Третья группа 5013 включает в себя данные 5005 сжатых изображений, дополняющие данные 5006, код 5007 конца последовательности и код 5008 конца потока. Области со штриховкой на фиг. 50 показывают дополнительные данные 5004, состоящие только из метаданных 5009 смещения, а пунктирные области показывают данные 5011, 5001-5003, размещаемые перед дополнительными данными в PES-пакете 5010. Аналогично TS-пакетам в последовательности 1520, показанной на фиг. 15, TS-пакеты 5030 и 5050, расположенные в концах первой группы 5021 и второй группы 5022, соответственно, в общем, включают в себя AD-поля 5032 и 5052. При такой структуре, три группы 5021-5023 являются отдельными друг от друга. TS-заголовки 5031 и 5061 TS-пакетов 5030 и 5060, принадлежащих первой группе 5021 и третьей группе 5023, указывают PID=0x1012. Здесь, TS-заголовки 5031 TS-пакетов 5030, принадлежащих первой группе 5021, могут указывать PID=0x1022. С другой стороны, TS-заголовки 5041 и 5051 TS-пакетов 5040 и 5050, принадлежащих второй группе 5022, указывают PID=0x1022. Шестнадцатеричное значение "0x1022" может заменяться на любое другое значение за исключением шестнадцатеричных значений, назначенных другим элементарным потокам. Таким образом, TS-пакеты, принадлежащие второй группе 5022, имеют PID, отличный от TS-пакетов, принадлежащих третьей группе 5023. Соответственно, декодер системных целевых объектов может легко выбирать TS-пакеты, принадлежащие второй группе, посредством использования PID.
Декодер системных целевых объектов извлекает метаданные смещения из последовательности 5020 TS-пакетов, показанной на фиг. 50, следующим образом. Фиг. 51 является функциональной блок-схемой, показывающей систему обработки видеопотоков в декодере 5125 системных целевых объектов. Декодер 5125 системных целевых объектов, показанный на фиг. 51, в отличие от декодера 4225, показанного на фиг. 45, не включает в себя фильтр 4551 TS-приоритетов. Другие его компоненты являются аналогичными соответствующим компонентам. На фиг. 51, компоненты, аналогичные компонентам, показанным на фиг. 45, отмечаются с помощью идентичных ссылок с номерами. Кроме того, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 45.
Второй PID-фильтр 4514 передает TS-пакеты с PID=0x1012 в TB2 4508 в декодере 4515 первичного видео и передает TS-пакеты с PID=0x1022 в процессор 4552 метаданных смещения. Здесь, TS-пакеты с PID=0x1022 могут передаваться в TB2 4508 параллельно. Таким образом, TS-пакеты, содержащие метаданные смещения, передаются в процессор 4552 метаданных смещения.
Следует отметить, что данные, отличные от TS-приоритета и PID, могут использоваться для того, чтобы выбирать TS-пакеты, содержащие метаданные смещения, из суб-TS. Если данные, такие как TS-приоритет и PID, дают возможность задания различного значения для каждого TS-пакета, данные могут использоваться для того, чтобы выбирать вышеописанные TS-пакеты. Это должно быть очевидным для специалистов в данной области техники из вышеописанного варианта осуществления.
(1-B-7) Метаданные 1110 смещения согласно варианту осуществления 1 настоящего изобретения, как показано на фиг. 11, предоставляют для каждого кадра информацию смещения. Альтернативно, когда видеопоток представляет кадр способом чередования (например, 601), единицей отображения является не кадр, а поле. В этом случае, метаданные смещения могут предоставлять для каждого поля информацию смещения или предоставлять для пары полей, составляющих каждый кадр, информацию смещения.
(1-B-8) В метаданных смещения согласно варианту осуществления 1 настоящего изобретения, каждая последовательность смещений задает значение смещения для каждого кадра. Альтернативно, каждая последовательность смещений может задавать функцию, которая представляет изменение во времени значения смещения для каждого времени представления, т.е. функцию выполнения. В этом случае, устройство трехмерного воспроизведения использует функцию выполнения в каждое время представления, чтобы вычислять значение смещения для каждого кадра, включенного в это время представления.
Фиг. 52A является схематичным представлением, показывающим структуру данных для метаданных 5200 смещения, которые используют функцию выполнения. Как показано на фиг. 52A, метаданные 5200 смещения включают в себя таблицу соответствия между идентификаторами 5210 последовательностей смещений и последовательностями 5220 смещений. Последовательность 5220 смещений включает в себя начальное значение 5221 смещения (offset_start), конечное значение 5222 смещения (offset_end), идентификатор 5223 функции смещения (offset_func_id) и длительность 5224 смещения (offset_duration). Когда метаданные 5200 смещения сохраняются в видеопоследовательности в видеопотоке для воспроизведения зависимого вида, начальное значение 5221 смещения указывает значение смещения для первого кадра, представленного посредством видеопоследовательности. Конечное значение 5222 смещения указывает значение смещения для первого кадра, представленного посредством следующей видеопоследовательности. Идентификатор 5223 функции смещения задает тип функции выполнения. Тип функции выполнения представляет форму изменений значения смещения в течение времени представления видеопоследовательности. Длительность 5224 смещения указывает длину времени представления видеопоследовательности.
Фиг. 52B является графиком, показывающим типы элементов в функции выполнения. Как показано на фиг. 52B, ось X представляет время представления, а ось Y представляет значение смещения. В этом контексте знак значения смещения определяется посредством глубины графического изображения, т.е. посредством того, дальше или ближе экрана находится трехмерное графическое изображение. Предусмотрено три типа элементов в функции выполнения: линейная форма LNR, выпуклая форма CVX и вогнутая форма CCV. Линейная форма LNR задается посредством линейной функции y=ax+b, тогда как выпуклая форма CVX и вогнутая форма CCV задаются посредством кривой второй степени ax2+bx+c, кривой третьей степени y=ax3+bx2+cx+d или кривой гамма-распределения y=a(x+b)1/r+c. В этом контексте константы a, b, c и d - это параметры, определенные посредством координат XY каждого края A, B каждого элемента, т.е. посредством пары из времени представления и значения смещения в этой точке. С другой стороны, константа r отдельно задается и сохраняется в каждой последовательности смещений. Типы функций выполнения задаются посредством одного из этих элементов LNR, CVX и CCV или комбинации вышеозначенного.
Фиг. 52C является графиком, показывающим значения смещения, вычисляемые посредством устройства трехмерного воспроизведения из идентификаторов последовательностей смещений=0, 1, 2, показанных на фиг. 52A. Как показано на фиг. 52C, горизонтальная ось графика представляет прошедшее время с момента, когда первый кадр в каждой видеопоследовательности отображен; в видеопоследовательности сохраняется последовательность смещений. Черные круги A0, B0, A1, B1, A2 и B2 указывают координаты, заданные посредством либо начального значения 5221 смещения, либо конечного значения 5222 смещения и длительности 5224 смещения. Линии GR0, GR1 и GR2, которые, соответственно, соединяют пары черных кругов A0+B0, A1+B1 и A2+B2, представляют функции выполнения, которые определяются посредством типа функции выполнения, указываемой в функции ED 5223 смещения, и посредством значений координат черных кругов A0+B0, A1+B1 и A2+B2 на краях линий. В последовательности смещений с идентификатором последовательности смещений=0, идентификатор 5223 функции смещения указывает "линейную", и тем самым черные круги A0 и B0 на любом краю соединяются посредством линии #0 GR0 с линейной формой LNR. В последовательности смещений с идентификатором последовательности смещений=1, идентификатор 5223 функции смещения указывает "кривую #1", и тем самым черные круги A1 и B1 на любом краю соединяются посредством линии #1 GR1 с выпуклой формой CVX. В последовательности смещений с идентификатором последовательности смещений=2, идентификатор 5223 функции смещения указывает "кривую #2", и тем самым черные круги A2 и B2 на любом краю соединяются посредством линии #2 GR2, которая формируется посредством комбинации выпуклой формы CVX и вогнутой формы CCV. Белые круги представляют пары из времени представления для кадра и значения смещения для кадра, вычисляемые посредством устройства трехмерного воспроизведения с использованием функции выполнения, указываемой посредством каждой из линий GR0, GR1 и GR2. Как очевидно из этих линий GR0, GR1 и GR2, простая комбинация начального значения 5221 смещения, конечного значения 5222 смещения, идентификатора 5223 функции смещения и длительности 5224 смещения может представлять множество изменений значения смещения, т.е. глубину трехмерных графических изображений. Соответственно, общий размер метаданных смещения может уменьшаться без потери способности выражать трехмерные графические изображения.
(1-C) В файле AV-потока для трехмерных видеоизображений, данные, касающиеся формата воспроизведения трехмерных видеоизображений, могут добавляться в PMT 1810, показанную на фиг. 18. В этом случае, PMT 1810 включает в себя трехмерные дескрипторы в дополнение к PMT-заголовку 1801, дескрипторам 1802 и фрагментам информации 1803 потока. Трехмерные дескрипторы являются информацией о формате воспроизведения трехмерных видеоизображений, совместно используются посредством всего файла AV-потока и, в частности, включают в себя информацию трехмерного формата. Информация трехмерного формата указывает формат воспроизведения, такой как L/R-режим или режим глубины, трехмерных видеоизображений в файле AV-потока. Каждый фрагмент информации 1803 потока включает в себя трехмерные дескрипторы потоков в дополнение к типу 1831 потока, PID 1832 и дескрипторам 1833 потока. Трехмерные дескрипторы потоков указывают информацию о формате воспроизведения трехмерных видеоизображений для каждого элементарного потока, включенного в файл AV-потока. В частности, трехмерные дескрипторы потоков видеопотока включают в себя тип трехмерного отображения. Тип трехмерного отображения указывает то, являются видеоизображения, указываемые посредством видеопотока, видом для просмотра левым глазом или видом для просмотра правым глазом, когда видеоизображения отображаются в L/R-режиме. Тип трехмерного отображения также указывает то, являются видеоизображения, указываемые посредством видеопотока, двумерными видеоизображениями или картами глубины, когда видеоизображения отображаются в режиме глубины. Когда PMT тем самым включает в себя информацию, касающуюся формата воспроизведения трехмерных видеоизображений, система воспроизведения этих видеоизображений может получать эту информацию просто из файла AV-потока. Этот вид структуры данных, следовательно, является полезным при распространении трехмерного видеосодержимого через широковещательную передачу.
(1-D) Файл информации о клипах
Файл информации о клипах для воспроизведения зависимого вида может включать в себя, для информации 2220 атрибутов потока, такой как на фиг. 22, предварительно определенный флаг в информации атрибутов видеопотока, выделяемой для PID=0x1012, 0x1013 видеопотока для воспроизведения зависимого вида. Когда помечен, этот флаг указывает то, что видеопоток для воспроизведения зависимого вида обращается к видеопотоку для воспроизведения базового вида. Кроме того, информация атрибутов видеопотока может включать в себя информацию, касающуюся видеопотока для воспроизведения базового вида, к которому обращается видеопоток для воспроизведения зависимого вида. Эта информация может использоваться для того, чтобы подтверждать соответствие между видеопотоками при верификации, через предварительно определенное инструментальное средство, того, создано трехмерное видеосодержимое в соответствии с заданным форматом или нет.
Согласно варианту осуществления 1 настоящего изобретения, размер экстентов для воспроизведения базового вида и экстентов для воспроизведения зависимого вида может вычисляться из начальных точек 2242 и 2420 экстентов, включенных в файл информации о клипах. Альтернативно, список размера каждого экстента может сохраняться, например, в файле информации о клипах как часть метаданных.
(1-E) Файл списков воспроизведения
(1-E-1) Файл 222 списков для трехмерного воспроизведения, показанный на фиг. 31, включает в себя один подпуть. Альтернативно, файл списков для трехмерного воспроизведения может включать в себя множество подпутей. Например, если типом подпути для одного подпути является "трехмерный L/R", то типом подпути для другого подпути может быть "трехмерная глубина". Посредством переключения между этими двумя типами подпутей при воспроизведении трехмерных видеоизображений в соответствии с файлом списков для трехмерного воспроизведения, устройство 102 воспроизведения может легко переключаться между L/R-режимом и режимом глубины. В частности, такое переключение может выполняться быстрее, чем переключение самого файла списков для трехмерного воспроизведения.
Множество видеопотоков для воспроизведения зависимого вида может представлять идентичные трехмерные видеоизображения в комбинации с совместно используемым видеопотоком для воспроизведения базового вида. Тем не менее, параллакс между видом для просмотра левым глазом и видом для просмотра правым глазом для одной сцены отличается между видеопотоками для воспроизведения зависимого вида. Эти видеопотоки для воспроизведения зависимого вида могут быть мультиплексированы в один суб-TS или разделены на различные суб-TS. В этом случае, файл списков для трехмерного воспроизведения включает в себя множество подпутей. Каждый подпуть обращается к различному видеопотоку для воспроизведения зависимого вида. Посредством переключения между подпутями при воспроизведении трехмерных видеоизображений в соответствии с файлом списков для трехмерного воспроизведения, устройство 102 воспроизведения может легко изменять ощущение глубины трехмерных видеоизображений. В частности, такая обработка может выполняться быстрее, чем переключение самого файла списков для трехмерного воспроизведения.
Фиг. 53 является схематичным представлением, показывающим (i) структуру данных файла 5300 списков для трехмерного воспроизведения, который включает в себя множество подпутей, и (ii) структуру данных файла 2D 5310 и двух файлов DEP 5321 и 5322, к которым обращается файл 5300 списков для трехмерного воспроизведения. Файл 2D 5310 включает в себя видеопоток для воспроизведения базового вида с PID=0x1011. Файл DEP #1 5321 включает в себя видеопоток для воспроизведения зависимого вида #1 с PID=0x1012. Файл DEP #2 5322 включает в себя видеопоток для воспроизведения зависимого вида #2 с PID=0x1013. В комбинации с видеопотоком для воспроизведения базового вида в файле 2D 5310, видеопотоки для воспроизведения зависимого вида #1 и #2 отдельно представляют идентичные трехмерные видеоизображения. Тем не менее, параллакс между видом для просмотра левым глазом и видом для просмотра правым глазом для одной сцены отличается между видеопотоками для воспроизведения зависимого вида #1 и #2. Кроме того, последовательности смещений с идентичным идентификатором последовательности смещений задают различные значения смещения для одного номера кадра.
Файл 5300 списков для трехмерного воспроизведения включает в себя основной путь 5330 и два подпути 5331 и 5332. PI #1 основного пути 5330 обращается к файлу 2D 5310, в частности, к видеопотоку для воспроизведения базового вида. SUB_PI #1 каждого из подпутей 5331 и 5332 использует время воспроизведения, идентичное времени воспроизведения PI #1 в основном пути 5330. SUB_PI #1 подпути #1 5331 обращается к файлу DEP #1 5321, в частности, к видеопотоку для воспроизведения зависимого вида #1. SUB_PI #1 подпути #2 5332 обращается к файлу DEP #2 5322, в частности, к видеопотоку для воспроизведения зависимого вида #2. Это также применимо к PI #2 основного пути 5330 и SUB_PI #2 каждого из подпутей 5331 и 5332.
Во время обработки воспроизведения по списку для трехмерного воспроизведения файла 5300 списков для трехмерного воспроизведения, устройство 102 воспроизведения сначала инструктирует пользователю или прикладной программе выбирать подпуть для воспроизведения. Альтернативно, устройство 102 воспроизведения может выбирать подпуть для воспроизведения согласно размеру экрана дисплейного устройства 103 или может выбирать подпуть посредством обращения к межзрачковому расстоянию зрителя. Посредством выбора подпути таким образом, параллакс между видеоплоскостями для просмотра левым глазом и правым глазом может легко изменяться. Кроме того, поскольку информация смещения изменяется в результате переключения видеопотока для воспроизведения зависимого вида, смещения графических плоскостей, воспроизводимых из PG-потока или IG-потока, включенного в файл 2D 5310, изменяются. Это помогает изменять ощущение глубины трехмерных видеоизображений.
(1-E-2) В файле списков для трехмерного воспроизведения, показанном на фиг. 31, видеопоток для воспроизведения базового вида регистрируется в STN-таблице 3205 в основном пути 3101, и видеопоток для воспроизведения зависимого вида регистрируется в STN-таблице SS 3130 в расширенных данных 3103. Альтернативно, видеопоток для воспроизведения зависимого вида может быть зарегистрирован в STN-таблице. В этом случае, STN-таблица может включать в себя флаг, указывающий, какой из базового вида и зависимого вида представляется посредством зарегистрированного видеопотока.
(1-E-3) Согласно варианту осуществления 1 настоящего изобретения, файлы списков для двумерного воспроизведения и файлы списков для трехмерного воспроизведения сохраняются отдельно в BD-ROM-диске 101. Альтернативно, аналогично расширенным данным 3103, подпуть 3102, показанный на фиг. 31, может записываться в область, к которой устройство 102 воспроизведения обращается только в режиме трехмерного воспроизведения. В этом случае, файлы списков для трехмерного воспроизведения, как есть, могут использоваться в качестве файлов списков для двумерного воспроизведения, поскольку отсутствует риск того, что подпуть 3102 приводит к неправильному функционированию устройства 102 воспроизведения в режиме двумерного воспроизведения. Как результат, авторинг (процесс авторского создания мультимедийного продукта) BD-ROM-диска упрощается.
(1-E-4) Идентификаторы опорного смещения и значения регулирования смещения для PG-потока, IG-потока и потока текстовых субтитров могут сохраняться в STN-таблице SS 3130 вместо STN-таблицы 3205. Альтернативно, эта информация может храниться в информации 2220 атрибутов потока в файле информации о клипах. Кроме того, идентификатор опорного смещения может сохраняться в записи субтитра для каждого PG-потока и потока текстовых субтитров или может сохраняться на каждой странице IG-потока.
(1-E-5) Когда идентификаторы опорного смещения задаются в файле списков для трехмерного воспроизведения, следующие ограничивающие условия могут быть заданы для плавного соединения между PI. Например, когда CC=5 задается в PI #2 основного пути 5330, показанного на фиг. 53, видеоизображения в секциях воспроизведения, заданных посредством PI #1 и PI #2, должны соединяться плавно. В этом случае, в PI #1 и PI #2, изменения запрещаются как для значений идентификаторов опорного смещения, так и для числа последовательностей смещений, включенных в видеопоток для воспроизведения зависимого вида, т.е. для числа записей. Кроме того, изменения значений регулирования смещения и числа их записей могут запрещаться. При этих ограничивающих условиях, устройство 102 воспроизведения может пропускать обновление SPRM(27) при изменении текущего PI с PI #1 на PI #2. Поскольку нагрузка по обработке для плавного соединения тем самым уменьшается, надежность этой обработки дополнительно может повышаться. Как результат, может повышаться качество трехмерных видеоизображений.
(1-E-6) В STN-таблице, два или более значений регулирования смещения могут задаваться для одного фрагмента потоковых данных. Фиг. 54 является принципиальной схемой, показывающей такую STN-таблицу 5400. Как показано на фиг. 54, STN-таблица 5400 ассоциирует STN 5401 с записью 5410 потока для PG-потока 1 и фрагментом информации 5403 атрибутов потока. Информация 5403 атрибутов потока включает в себя три типа значений 5411-5413 регулирования смещения #1-#3 наряду с идентификатором 5410 опорного смещения. Эти значения регулирования смещения используются для того, чтобы изменять смещение в зависимости от размера экрана дисплейного устройства; смещение должно предоставляться в графическую плоскость, сформированную из PG-потока 1.
Допустим, что соответствие между типами значений регулирования смещения и размеров экрана указывается заранее. В частности, значение 5411 регулирования смещения #1, значение 5412 регулирования смещения #2 и значение 5413 регулирования смещения #3, соответственно, используются, когда размер экрана находится в диапазоне 0-33 дюймов, 34-66 дюймов и 67 дюймов и более. Значения 5411-5413 регулирования смещения задаются так, чтобы удовлетворять следующему условию: параллаксы между графическими изображениями для просмотра левым глазом и правым глазом, сформированные посредством предоставления смещения в графическую плоскость, имеют максимальное значение, равное или меньшее межзрачковому расстоянию зрителя общего типа (в случае ребенка, 5 см или меньше). До тех пор, пока это условие удовлетворяется, параллакс не должен превышать межзрачковое расстояние зрителя. Это может уменьшать риск подвергания зрителя морской болезни и чрезмерному напряжению зрения вследствие работы зрительной системы.
Каждый раз, когда изменение текущего PI приводит к изменению общего числа значений регулирования смещения, выделяемых фрагменту потоковых данных, модуль 4235 управления воспроизведением устройства 102 воспроизведения выбирает значения регулирования смещения, которые должны использоваться фактически, в зависимости от размера экрана дисплейного устройства 103. В частности, модуль 4235 управления воспроизведением сначала обнаруживает размер экрана дисплейного устройства 103, в случае необходимости, посредством выполнения HDMI-аутентификации. Модуль 4235 управления воспроизведением далее выбирает одно из значений регулирования смещения #1-#3, 4801-4803, в зависимости от того, в какой диапазон попадает размер экрана дисплейного устройства 103: 0-33 дюйма, 34-66 дюймов, 67 дюймов или более. Модуль 4235 управления воспроизведением сохраняет информацию, представляющую тип выбранного значения, как переменную проигрывателя в модуле 4236 хранения переменных проигрывателя. Таким образом, до того, как выбор значений регулирования смещения выполняется снова, модуль 4235 управления воспроизведением выбирает значения регулирования смещения типа, указываемого посредством переменной проигрывателя, из каждой STN-таблицы и затем обновляет значение SPRM(28) на выбранное значение.
(1-F) Индексный файл 211, показанный на фиг. 35, включает в себя флаг 3520 существования трехмерного режима и флаг 3530 предпочтения двумерного/трехмерного режима, совместно используемые посредством всех тайтлов. Альтернативно, индексный файл может указывать различный флаг существования трехмерного режима или флаг предпочтения двумерного/трехмерного режима для каждого тайтла.
(1-G) SPRM(27), SPRM(28)
(1-G-1) Модуль 4234 выполнения программ может устанавливать значения SPRM(27) 4751 и SPRM(28) 4752 в соответствии с кинообъектом или BD-J-объектом. Другими словами, устройство 102 воспроизведения может инструктировать прикладной программе задавать идентификатор опорного смещения и значение регулирования смещения. Кроме того, такая прикладная программа может быть ограничена объектом, ассоциированным с элементом "первый элемент воспроизведения" 3501 в индексной таблице 3510.
(1-G-2) Модуль 4235 управления воспроизведением может инструктировать зрителю регулировать смещение, которое должно предоставляться в графическую плоскость. В частности, когда зритель оперирует с пультом 105 дистанционного управления или передней панелью устройства 102 воспроизведения и запрашивает задавать значение регулирования смещения, сначала процессор 4233 пользовательских событий принимает запрос и сообщает в модуль 4235 управления воспроизведением запрос. Затем, в ответ на запрос, модуль 4235 управления воспроизведением отображает функциональный экран для регулирования смещения на дисплейном устройстве 103. Здесь, OSD устройства 102 воспроизведения используется для отображения этого функционального экрана. Модуль 4235 управления воспроизведением дополнительно инструктирует зрителю выбирать графическую плоскость для регулирования и увеличения/уменьшения значения смещения через операции с пультом 105 дистанционного управления и т.п. Модуль 4235 управления воспроизведением затем обновляет SPRM(28), чтобы добавлять или вычитать предварительно определенное значение к/из значения регулирования смещения, соответствующему выбранной графической плоскости. Предпочтительно, во время обработки регулирования, модуль 4235 управления воспроизведением инструктирует модулю 4202 воспроизведения продолжать обработку воспроизведения графической плоскости. Здесь, модуль 4202 воспроизведения делает функциональный экран или графическое изображение (что из этого отображается ближе к зрителю) полупрозрачным или отображает функциональный экран ближе, чем графическое изображение. Это делает графическое изображение видимым, даже когда функциональный экран отображается, и тем самым зритель может сразу подтверждать эффект увеличения или уменьшения значения смещения способом, идентичным регулированию яркости или цвета экрана.
(1-G-3) Для управления смещением, каждый из модулей 4731-4734 кадрирования, показанных на фиг. 47, использует последовательность смещений, указываемую посредством идентификаторов опорного смещения, указываемых посредством SPRM(27). В отличие от этого, для управления смещением, каждый модуль 4731-4734 кадрирования может быть задан не использовать последовательность смещений, указываемую посредством каждого идентификатора последовательности смещений, указываемого посредством предварительно определенного SPRM. Другими словами, SPRM может указывать идентификаторы последовательностей смещений (PG_ref_offset_id_mask, IG_ref_offset_id_mask, SV_ref_offset_id_mask, IM_ref_offset_id_mask), которые должны маскироваться во время управления смещением. В этом случае, каждый из модулей 4731-4734 кадрирования может выбирать идентификатор последовательности смещений, которая включает в себя наибольшее значение смещения из последовательностей смещений, которые принимаются из декодера 4225 системных целевых объектов и выделяются идентификаторам последовательностей смещений, не замаскированным в информации 4707 смещения. Таким образом, глубина графических изображений, представленных посредством плоскости вторичного видео, PG-плоскости, IG- плоскости и плоскости изображений, может легко совмещаться. Это предоставляет возможность увеличения степени свободы при создании каждого фрагмента потоковых данных.
(1-H) При отображении меню, уникального для устройства 102 воспроизведения как OSD, устройство 102 воспроизведения может выполнять управление смещением для графической плоскости, представляющей двумерные видеоизображения в меню, т.е. на OSD-плоскости. В этом случае, устройство 102 воспроизведения может выбирать, в рамках информации смещения, передаваемой посредством декодера 4225 системных целевых объектов во время представления меню, информацию смещения, которая имеет направление смещения, которое ближе к зрителю, чем экран, и которая имеет наибольшее значение смещения. Меню тем самым может отображаться ближе любого трехмерного графического изображения, такого как субтитры и т.п., воспроизводимого из трехмерного видеосодержимого.
Альтернативно, устройство 102 воспроизведения может предварительно сохранять информацию смещения для OSD-плоскости. Конкретный идентификатор последовательности смещений, такой как offset_id=0, выделяется этой информации смещения. Кроме того, следующие два условия могут быть заданы для информации смещения с идентификатором последовательности смещений=0: (1) направление смещения ближе к зрителю, чем экран, и (2) значение смещения является равным наибольшему значению смещения из значений, включенных во фрагменты информации смещения, которые (i) выделены идентификаторам последовательностей смещений, отличным от нуля, (ii) соответствуют одному номеру кадра, и (iii) имеют направления смещения ближе к экрану, чем зритель. При этом предписании, устройство 102 воспроизведения не должно выбирать информацию смещения из информации смещения, передаваемой посредством декодера 4225 системных целевых объектов, тем самым упрощая управление смещением OSD-плоскости. Кроме того, каждый из модулей 4731-4734 кадрирования может использовать информацию смещения для идентификатора последовательности смещений=0 в качестве замены, когда не может обнаруживать идентификаторы опорного смещения, указываемые посредством SPRM(27), в информации 4707 смещения, принимаемой из декодера 4225 системных целевых объектов.
(1-1) В устройстве трехмерного воспроизведения, в дополнение к заданию уровня родительского контроля в SPRM(13), уровень родительского контроля для трехмерного режима может задаваться в SPRM(30). Уровень родительского контроля для трехмерного режима указывает предварительно определенный ограниченный возраст и используется для родительского контроля просмотра тайтлов трехмерного видео, записанных на BD-ROM-диске 101. Аналогично значению в SPRM(13), пользователь устройства трехмерного воспроизведения задает значение SPRM(30), например, через OSD устройства трехмерного воспроизведения. Ниже приводится пример того, как устройство трехмерного воспроизведения выполняет родительский контроль для каждого тайтла трехмерного видео. Устройство трехмерного воспроизведения сначала считывает, из BD-ROM-диска 101, возраст, для которого просмотр тайтла в режиме двумерного воспроизведения разрешен, и сравнивает этот возраст со значением SPRM(13). Если этот возраст равен или меньше значения SPRM(13), устройство трехмерного воспроизведения прекращает воспроизведение тайтла. Если этот возраст превышает значение SPRM(13), устройство трехмерного воспроизведения считывает, из BD-ROM-диска 101, возраст, для которого просмотр тайтла в режиме трехмерного воспроизведения разрешен, и сравнивает этот возраст со значением SPRM(30). Если этот возраст равен или превышает значение SPRM(30), устройство трехмерного воспроизведения воспроизводит тайтл в режиме трехмерного воспроизведения. Если этот возраст меньше значения SPRM(30) и равен или превышает значение SPRM(13), устройство трехмерного воспроизведения воспроизводит тайтл в режиме двумерного воспроизведения. Таким образом, с учетом различий в межзрачковом расстоянии зрителя в зависимости от возраста можно реализовывать родительский контроль так, что, например, "дети, возраст которых меньше предварительно определенного значения, могут просматривать трехмерные видеоизображения только как двумерные видеоизображения". Предпочтительно, родительский контроль выполняется, когда определено то, что "дисплейное устройство поддерживает воспроизведение трехмерных видеоизображений" при обработке выбора файла списков воспроизведения для воспроизведения, показанной на фиг. 36, а именно, когда определяется "ДА" на этапе S3605. Следует отметить, что разрешение/запрет указания значения режима трехмерного воспроизведения может задаваться в SPRM(30) вместо уровня родительского контроля, и устройство трехмерного воспроизведения может определять то, является режим трехмерного воспроизведения допустимым или недопустимым, в соответствии со значением.
(1-J) В устройстве трехмерного воспроизведения, значение, указывающее то, "какой из режима двумерного воспроизведения и режима трехмерного воспроизведения должен приоритезироваться", может задаваться в SPRM(31). Пользователь устройства трехмерного воспроизведения задает значение SPRM(31), например, через OSD устройства трехмерного воспроизведения. На этапе S3603 при обработке выбора файла списков воспроизведения для воспроизведения, показанной на фиг. 36, устройство трехмерного воспроизведения обращается к SPRM(31), а также к флагу предпочтения двумерного/трехмерного режима. Когда как SPRM(31), так и флаг предпочтения двумерного/трехмерного режима указывают режим двумерного воспроизведения, устройство трехмерного воспроизведения выбирает режим двумерного воспроизведения. Когда как SPRM(31), так и флаг предпочтения двумерного/трехмерного режима указывают режим трехмерного воспроизведения, устройство трехмерного воспроизведения переходит к этапу S3605 и выполняет HDMI-аутентификацию без отображения экрана выбора режима воспроизведения. Как результат, когда дисплейное устройство поддерживает трехмерные видеоизображения, устройство трехмерного воспроизведения выбирает режим трехмерного воспроизведения. Когда SPRM(31) и флаг предпочтения двумерного/трехмерного режима указывают различные режимы воспроизведения, устройство трехмерного воспроизведения выполняет этап S3604, т.е. отображает экран выбора режима воспроизведения, чтобы инструктировать пользователю выбирать режим воспроизведения. Альтернативно, устройство трехмерного воспроизведения может инструктировать прикладной программе выбирать режим воспроизведения. Таким образом, даже если флаг предпочтения двумерного/трехмерного режима задается в трехмерном видеосодержимом, можно инструктировать пользователю выбирать режим воспроизведения только, когда режим воспроизведения, указываемый посредством флага предпочтения двумерного/трехмерного режима, не совпадает с режимом воспроизведения, указываемым посредством SPRM(31), который является режимом воспроизведения, заданным пользователем заранее.
Прикладная программа, такая как BD-J-объект, может выбирать режим воспроизведения посредством обращения к SPRM(31). Кроме того, прикладная программа может определять начальное состояние меню, которое должно отображаться на экране выбора, в зависимости от значения SPRM(31), при инструктировании пользователю выбирать режим воспроизведения на этапе S3604, показанном на фиг. 36. Например, когда значение SPRM(31) указывает, что режим двумерного воспроизведения имеет высокий приоритет, меню отображается в состоянии, в котором курсор располагается на кнопке выбора режима двумерного воспроизведения; когда значение SPRM(31) указывает, что режим трехмерного воспроизведения имеет высокий приоритет, меню отображается в состоянии, в котором курсор располагается на кнопке выбора режима трехмерного воспроизведения. Альтернативно, когда устройство трехмерного воспроизведения имеет функцию, чтобы управлять учетными записями множества пользователей, к примеру, отца, матери и ребенка, устройство трехмерного воспроизведения может задавать значение равным SPRM(31) в зависимости от учетной записи пользователя, зарегистрированного в настоящий момент.
Значение SPRM(31) может указывать, "какой из режима двумерного воспроизведения и режима трехмерного воспроизведения должен всегда задаваться", в дополнение к тому, "какой из режима двумерного воспроизведения и режима трехмерного воспроизведения должен приоритезироваться". Когда значение SPRM(31) указывает, что "режим двумерного воспроизведения должен всегда задаваться", устройство трехмерного воспроизведения всегда выбирает режим двумерного воспроизведения независимо от значения флага предпочтения двумерного/трехмерного режима. В этом случае, значение SPRM(25) задается так, чтобы указывать режим двумерного воспроизведения. Когда значение SPRM(31) указывает, что "режим трехмерного воспроизведения должен всегда задаваться", устройство трехмерного воспроизведения выполняет HDMI-аутентификацию без отображения экрана выбора режима воспроизведения независимо от значения флага предпочтения двумерного/трехмерного режима. В этом случае, значение SPRM(25) задается так, чтобы указывать режим трехмерного воспроизведения (L/R-режим или режим глубины). Таким образом, даже если флаг предпочтения двумерного/трехмерного режима задается в трехмерном видеосодержимом, можно разрешать быть всегда приоритезированным режиму воспроизведения, заданному пользователем заранее.
(1-K) Устройство 102 воспроизведения может инструктировать пользователю регистрировать межзрачковое расстояние как зарезервированный SPRM, например, SPRM(32). В этом случае, устройство 102 воспроизведения может регулировать значение регулирования смещения так, что максимальное значение параллакса между графическими изображениями для просмотра левым глазом и правым глазом не превышает значение, зарегистрированное в SPRM(32). В частности, достаточно для устройства 102 воспроизведения выполнять следующие вычисления для каждого значения смещения, выводимого посредством декодера системных целевых объектов. Устройство 102 воспроизведения сначала находит отношение значения SPRM(32) к ширине (горизонтальной длине) экрана дисплейного устройства 103 и дополнительно находит произведение этого отношения и числа горизонтальных пикселов дисплейного устройства 103. Это произведение в два раза превышает верхний предел смещения, которое может предоставляться в графическую плоскость через управление смещением. Затем, устройство 102 воспроизведения сравнивает это произведение со значением, в два раза превышающим каждое значение смещения. Если значение, в два раза превышающее какое-либо значение смещения, равно или превышает произведение, устройство 102 воспроизведения идентифицирует идентификатор последовательности смещений, которая включает в себя значение смещения, и уменьшает значение регулирования смещения для графической плоскости, указываемой посредством этого идентификатора. Объем уменьшения задается равным, по меньшей мере, половине разности между значением, в два раза превышающим значение смещения, и вышеуказанным произведением. Максимальное значение параллакса между графическим изображением для просмотра левым глазом и правым глазом тем самым не превышает межзрачковое расстояние зрителя. Это может уменьшать риск подвергания зрителя морской болезни и чрезмерному напряжению зрения вследствие работы зрительной системы.
(1-L) Регулирование выходного смещения
(1-L-1) Поскольку способ поочередной последовательности кадров представляет параллакс между видами для просмотра левым и правым глазом посредством числа пикселов в горизонтальном направлении, фактический размер параллакса зависит от размера экрана дисплейного устройства, а именно, размера пиксела. С другой стороны, ощущение глубины трехмерных видеоизображений зависит от фактического размера параллакса. Соответственно, чтобы не допускать нарушения сильного впечатления от ощущения глубины трехмерных видеоизображений на экране любого размера трехмерных видеоизображений и чрезмерного утомления глаз зрителя, параллакс между видами для просмотра левым и правым глазом должен регулироваться так, чтобы быть соответствующим размеру экрана. В качестве одного способа регулирования, устройство трехмерного воспроизведения дополнительно предоставляет смещение в конечные данные кадров, комбинированные посредством сумматоров плоскостей. Смещение предоставляется способом, аналогичным способу, которым смещение предоставляется в графическую плоскость в режиме 1 плоскости+смещения. Управление смещением, которое дополнительно применяется к конечным данным кадра, упоминается как "регулирование выходного смещения".
Фиг. 55A-55C являются принципиальными схемами, показывающими параллаксы PRA, PRB и PRC между видами для просмотра левым и правым глазом, отображаемыми на 32-дюймовом экране SCA, 50-дюймовом экране SCB и 100-дюймовом экране SCC, соответственно. Изображения LA1, LA2, LB, LC1 и LC2, начерченные на чертежах посредством сплошных линий, представляют виды для просмотра левым глазом, а изображения RA1, RA2, RB, RC1 и RC2, начерченные посредством пунктирных линий, представляют виды для просмотра правым глазом. Здесь, допустим, что видеосодержимое указывает параллаксы между видами для просмотра левым и правым глазом, чтобы формировать оптимальное ощущение глубины, когда трехмерные видеоизображения отображаются на 50-дюймовом экране. Как показано на фиг. 55B, параллакс между видом LB для просмотра левым глазом и видом RB для просмотра правым глазом равен оптимальному значению PRB, когда трехмерное видеоизображение, представленное посредством видеосодержимого, отображается на 50-дюймовом экране SCB.
Параллакс DA между видом LA1 для просмотра левым глазом и видом RA1 для просмотра правым глазом, начерченный посредством тонких линий на фиг. 55A, равен по числу горизонтальных пикселов параллаксу DB между видом LB для просмотра левым глазом и видом RB для просмотра правым глазом, начерченному на фиг. 55B. С другой стороны, пиксел на 32-дюймовом экране SCA меньше пиксела на 50-дюймовом экране SCB. Соответственно, трехмерные видеоизображения, сформированные посредством параллакса DA между видом LA1 для просмотра левым глазом и видом RA1 для просмотра правым глазом, начерченными посредством тонких линий, в общем, создают более слабое, чем оптимальное, ощущение глубины. В этом случае, регулирование выходного смещения увеличивает параллакс между видом для просмотра левым глазом и видом для просмотра правым глазом на значение, в два раза превышающее предварительно определенное значение CRA регулирования. Параллакс PRA между видом LA2 для просмотра левым глазом и видом RA2 для просмотра правым глазом, начерченный посредством толстых линий на фиг. 55A, указывает параллакс после регулирования выходного смещения. Таким образом, когда параллакс между видами для просмотра левым и правым глазом увеличивается, ощущение глубины трехмерных видеоизображений улучшается. Это исключает потерю трехмерными видеоизображениями сильного впечатления.
Параллакс DC между видом LC1 для просмотра левым глазом и видом RC1 для просмотра правым глазом, начерченный посредством тонких линий на фиг. 55C, равен по числу горизонтальных пикселов параллаксу PRB между видом LB для просмотра левым глазом и видом RB для просмотра правым глазом, начерченному на фиг. 55B. С другой стороны, пиксел 100-дюймового экрана SCC превышает пиксел 50-дюймового экрана SCB. Соответственно, трехмерные видеоизображения, сформированные посредством параллакса DC между видом LC1 для просмотра левым глазом и видом RC1 для просмотра правым глазом, начерченных посредством тонких линий, в общем, создают более сильное, чем оптимальное, ощущение глубины. В этом случае, регулирование выходного смещения сокращает параллакс между видом для просмотра левым глазом и видом для просмотра правым глазом на значение, в два раза превышающее предварительно определенное значение CRC регулирования. Параллакс PRC между видом LC2 для просмотра левым глазом и видом RC2 для просмотра правым глазом, начерченный посредством толстых линий на фиг. 55C, указывает параллакс после регулирования выходного смещения. Таким образом, когда параллакс между видами для просмотра левым и правым глазом снижается, ощущение глубины трехмерных видеоизображений подавляется. Это препятствует испытанию зрителем усталости глаз.
Значения CRA и CRC регулирования, показанные на фиг. 55A и 55C, упоминаются как "выходные значения регулирования смещения". Видеосодержимое включает в себя таблицу соответствия между размерами экрана и выходными значениями регулирования смещения, сохраненными в индексном файле, файле списков воспроизведения или файле информации о клипах. Фиг. 56A является принципиальной схемой, показывающей таблицу соответствия. Как показано на фиг. 56A, выходное значение регулирования смещения задается для каждого диапазона размера экрана с шириной 10 дюймов. Величина каждого выходного значения регулирования смещения указывает число горизонтальных пикселов, а его знак указывает увеличение/уменьшение параллакса между видами для просмотра левым и правым глазом. Следует отметить, что диапазон размера экрана может иметь ширину, отличную от 10 дюймов. Таблица соответствия задается согласно стандартам или пользователем. Кроме того, два или более типов таблиц соответствия могут записываться в устройство трехмерного воспроизведения заранее, и видеосодержимое может указывать идентификатор типа таблиц соответствия; тип должен использоваться во время воспроизведения видеосодержимого.
(1-L-2) Устройство трехмерного воспроизведения может использовать предварительно определенную функцию, чтобы выбирать выходное значение регулирования смещения, вместо вышеописанной таблицы соответствия. Фиг. 56B является графиком, представляющим функцию. Горизонтальная ось этого графика указывает размер экрана в дюймах, и вертикальная ось указывает выходное значение регулирования смещения, представленное посредством числа пикселов со знаком. Устройство трехмерного воспроизведения использует функцию, представленную посредством графика, чтобы вычислять выходное значение регулирования смещения из размера экрана дисплейного устройства. Как показывает график, выходное значение регулирования смещения является большим положительным значением, когда размер экрана меньше 50 дюймов, и большим отрицательным значением, когда размер экрана превышает 50 дюймов. Следует отметить, что выходное значение регулирования смещения поддерживается при практически постоянном положительном значении, когда размер экрана составляет 32 дюйма или менее, и выходное значение регулирования смещения поддерживается при практически постоянном отрицательном значении, когда размер экрана составляет 103 дюйма или более.
(1-L-3) Видеосодержимое может включать в себя оптимальное значение размера экрана, который допускается во время авторинга (assumed_TV_size_when_authoring), и устройство трехмерного воспроизведения может определять выходное значение регулирования смещения на основе оптимального значения. Например, когда размер экрана дисплейного устройства превышает оптимальное значение, устройство трехмерного воспроизведения сначала уменьшает размер кадра трехмерных видеоизображений до оптимального значения. Устройство трехмерного воспроизведения затем накладывает черную границу на края каждого кадра и принудительно задает весь кадр и черную границу как равную по размеру экрану дисплейного устройства. Устройство трехмерного воспроизведения дополнительно регулирует выходное значение регулирования смещения так, что параллакс между видами для просмотра левым и правым глазом, отображаемыми на черной границе, равен по величине параллаксу между видами для просмотра левым и правым глазом, если они отображаются на всем экране с размером, равным оптимальному значению. Это предоставляет возможность сохранения ощущения глубины трехмерных видеоизображений эквивалентным ощущению, предполагаемому во время авторинга.
(1-L-4) Фиг. 57 является блок-схемой, показывающей компоненты устройства трехмерного воспроизведения, требуемые для регулирования выходного смещения. Устройство 5700 трехмерного воспроизведения, показанное на фиг. 57, в отличие от устройства 4200, показанного на фиг. 42, включает в себя модуль 5701 применения выходных значений регулирования смещения. Другие его компоненты являются аналогичными соответствующим компонентам. На фиг. 57, компоненты, аналогичные компонентам, показанным на фиг. 42, отмечаются с помощью идентичных ссылок с номерами. Кроме того, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 42.
Модуль 4236 хранения переменных проигрывателя сохраняет выходные значения регулирования смещения в SPRM(36). Выходные значения регулирования смещения основаны на размере экрана, полученном посредством модуля 4237 HDMI-связи из дисплейного устройства 103 через HDMI-аутентификацию и определенном посредством модуля 4235 управления воспроизведением с использованием таблицы соответствия или функции, показанной на фиг. 56A или 56B. Альтернативно, прикладная программа, такая как BD-J-объект, может автоматически задавать значение SPRM(35) или инструктировать пользователю задавать значение посредством использования GUI.
Модуль 5701 применения выходных значений регулирования смещения использует выходное значение регулирования смещения, указываемое посредством SPRM(35), чтобы предоставлять смещение в каждые из данных кадра для просмотра левым глазом и правым глазом, комбинированных посредством сумматоров 4226 плоскостей. Регулирование выходного смещения данных кадра посредством модуля 5701 применения выходных значений регулирования смещения является аналогичным управлению смещением данных GP PG-плоскости посредством второго модуля 4732 кадрирования, показанного на фиг. 49.
(1-L-5) Размер экрана дисплейного устройства 103 может сохраняться в SPRM(35) вместо выходных значений регулирования смещения. В этом случае, модуль 5701 применения выходных значений регулирования смещения извлекает выходное значение регулирования смещения, ассоциированное с размером экрана, указываемым посредством SPRM(35), из таблицы соответствия, показанной на фиг. 56A.
(1-L-6) Модуль 4236 хранения переменных проигрывателя дополнительно может сохранять выходное значение регулирования смещения "альфа" в SPRM(36). Выходное значение регулирования смещения "альфа" представляет положительное числовое значение. Модуль 5701 применения выходных значений регулирования смещения использует произведение выходного значения регулирования смещения, указываемого посредством SPRM(35), и выходного значения регулирования смещения "альфа", указываемого посредством SPRM(36), в качестве фактического выходного значения регулирования смещения. Это предоставляет возможность глубинам трехмерных видеоизображений, регулируемым посредством регулирования выходного смещения, зависеть не только от размеров экрана, но также и от возраста зрителей. Например, когда зрители включают в себя ребенка с меньшим межзрачковым расстоянием, чем у взрослых, регулирование выходного смещения для небольшого размера экрана задает выходное значение регулирования смещения "альфа" равным значению меньше "1", а регулирование выходного смещения для большого размера экрана задает его равным значению больше "1". Это ослабляет ощущение глубины трехмерных видеоизображений независимо от размера экрана.
Модуль 4234 выполнения программ или модуль 4235 управления воспроизведением может использовать GUI или OSD, чтобы инструктировать пользователю задавать выходное значение регулирования смещения "альфа". В этом случае, допустимые уровни выходного значения регулирования смещения "альфа" могут представляться, например, посредством следующих трех уровней: "ощущение глубины трехмерных видеоизображений является сильным", "обычным" и "слабым". Альтернативно, выходное значение регулирования смещения "альфа" может сохраняться в дополнительных данных в видеопотоке, дескрипторе в PMT или PI в файле списков воспроизведения, включенном в видеосодержимое. При такой структуре, выходное значение регулирования смещения "альфа" может меняться в зависимости от сцен, представленных посредством видеопотока. В частности, выходное значение регулирования смещения "альфа" может задаваться так, чтобы уменьшаться в сцене, формирующей устойчивое ощущение глубины.
(1-L-7) Выходные значения регулирования смещения могут изменяться в зависимости от расстояния между зрителем и экраном вместо размера экрана. Кроме того, выходные значения регулирования смещения "альфа" могут зависеть от расстояния. В этом случае, например, датчик расстояния устанавливается на очках 104 с затвором, показанных на фиг. 1, и используется для того, чтобы измерять расстояние между дисплейным устройством 103 и экраном 131. Расстояние проходится от очков 104 с затвором к дисплейному устройству 103 в любое время и дополнительно проходится от дисплейного устройства 103 к устройству 102 воспроизведения через HDMI-кабель 122. Устройство 102 воспроизведения использует расстояние, чтобы выбирать выходное значение регулирования смещения или выходное значение регулирования смещения "альфа".
(1-L-8), Когда дисплейное устройство 103 является проектором, изображения укрупняются посредством линз и проецируются на экран. Соответственно, размер области отображения на экране изменяется в зависимости от расстояния между проектором и экраном. В этом случае, проектор определяет размер области отображения, например, посредством любого из следующих двух способов. Первый способ сначала измеряет расстояние между проектором и экраном и затем вычисляет размер области отображения на основе взаимосвязи между расстоянием и характеристиками оптической системы проектора, в частности, ракурса распространения подсветки проекции. Здесь, датчик расстояния, установленный на проекторе, используется для того, чтобы измерять расстояние. Например, датчик расстояния сначала излучает инфракрасное лазерное излучение и т.п. на экран и затем обнаруживает отраженный свет от экрана. Вместе с тем, датчик расстояния также измеряет продолжительность, прошедшую от выдачи лазерного излучения до обнаружения подсветки отражения. Датчик расстояния затем вычисляет расстояние между проектором и экраном из истекшего времени. Второй способ инструктирует проектору работать следующим образом: проектор сначала проецирует опорный графический объект, такой как сегмент прямой, на экран и далее использует OSD и т.п., чтобы побуждать зрителя измерять и вводить размер опорного графического объекта на экране. Проектор затем вычисляет размер области отображения из размера опорного графического объекта, вводимого зрителем.
(1-M) В некотором видеосодержимом, таком как содержимое для отображения текстов песен во время караоке, графическое изображение субтитров и т.п. многократно отображается как неподвижные изображения, и только графические изображения часто обновляются. Когда такое содержимое формируется в трехмерное видеосодержимое, VAU, в которой размещаются метаданные смещения, дополнительно включает в себя код конца последовательности. Когда устройство 102 воспроизведения декодирует эту VAU, оно сохраняет информацию смещения, полученную из метаданных смещения, и не изменяет информацию смещения до тех пор, пока VAU, которая включает в себя новые метаданные смещения, не декодирована.
Фиг. 58A является схематичным представлением, показывающим структуру данных видеопотока 5800 для воспроизведения зависимого вида, представляющего только неподвижные изображения. Каждая VAU в видеопотоке 5800 для воспроизведения зависимого вида представляет одно неподвижное изображение. В этом случае, код 5803, 5804 конца последовательности размещается в конце каждой VAU. Между тем, метаданные 5811, 5812 смещения размещаются в дополнительных данных 5801, 5802 каждой VAU. Метаданные 5811 смещения в VAU #1 включают в себя последовательность смещений [0] с идентификатором последовательности смещений=0. Эта последовательность смещений [0] включает в себя только информацию смещения для кадра #1. Аналогично, в метаданных 5812 смещения VAU #2, последовательность смещений [0] включает в себя только информацию смещения для кадра #1.
Здесь допускается, что файл списков для трехмерного воспроизведения указывает следующие два элемента: (1) неподвижные изображения, представленные посредством VAU в видеопотоке 5800 для воспроизведения зависимого вида, переключаются с 10-секундными интервалами, и (2) графические изображения, представленные посредством графического потока, перекрываются в каждом неподвижном изображении. Фиг. 58B является схематичным представлением, показывающим последовательность 5821 видеоплоскостей для просмотра левым глазом, последовательность 5822 видеоплоскостей для просмотра правым глазом и последовательность 5830 графических плоскостей, которые воспроизводятся в соответствии с файлом списков для трехмерного воспроизведения. На фиг. 58B, видеоплоскости в момент, когда неподвижное изображение переключается, показаны со штриховкой. В последовательности 5821 видеоплоскостей для просмотра левым глазом, неподвижное изображение, указываемое посредством первой видеоплоскости 5841, многократно воспроизводится в течение первого 10-секундного интервала 5861, и неподвижное изображение, указываемое посредством следующей видеоплоскости 5851, многократно воспроизводится в течение следующего 10-секундного интервала 5871. В последовательности 5822 видеоплоскостей для просмотра правым глазом, неподвижное изображение, указываемое посредством первой видеоплоскости 5842, многократно воспроизводится в течение первого 10-секундного интервала 5862, и неподвижное изображение, указываемое посредством следующей видеоплоскости 5852, многократно воспроизводится в течение следующего 10-секундного интервала 5872.
Когда устройство 102 воспроизведения декодирует VAU #1 в видеопотоке 5800 для воспроизведения зависимого вида, оно считывает информацию смещения для кадра #1 из метаданных 5811 смещения. Кроме того, устройство 102 воспроизведения обнаруживает код 5803 конца последовательности. Здесь, устройство 102 воспроизведения сохраняет информацию смещения для кадра #1. Таким образом, во время первого 10-секундного интервала 5861, смещение, предоставленное в последовательность 5830 графических плоскостей, поддерживается постоянным в соответствии с сохраненной информацией смещения. Другими словами, глубина графических изображений поддерживается постоянной.
После того, как 10 секунд прошло после декодирования VAU #1, устройство 102 воспроизведения декодирует VAU #2 и считывает новую информацию смещения для кадра #1 из метаданных 5812 смещения. Кроме того, устройство 102 воспроизведения обнаруживает код 5804 конца последовательности. Здесь, устройство 102 воспроизведения сохраняет информацию смещения для кадра #1. Таким образом, в течение следующего 10-секундного интервала 5871, смещение, предоставленное в последовательность 5830 графических плоскостей, изменяется и поддерживается постоянным в соответствии с заново сохраненной информацией смещения. Другими словами, графические изображения поддерживаются постоянными при новой глубине.
Когда VAU включает в себя код конца последовательности, устройству 102 воспроизведения тем самым инструктируется сохранять существующую информацию смещения как есть. Соответственно, даже когда видеопоток состоит только из неподвижных изображений, устройство 102 воспроизведения может надежно поддерживать управление смещением для графической плоскости.
(1-N) Компенсация несовмещения между видом для просмотра левым глазом и видом для просмотра правым глазом
Предусмотрены случаи, в которых "несовмещение" возникает между видом для просмотра левым глазом и видом для просмотра правым глазом. Устройство 102 воспроизведения или дисплейное устройство 103 согласно варианту осуществления 1 настоящего изобретения компенсирует несовмещение посредством использования средства, описанного ниже. Это предотвращает риск того, что несовмещение может вызывать чувство некомфортности у зрителей.
Устройство 102 воспроизведения использует функциональные модули, показанные на фиг. 42, чтобы компенсировать вышеуказанное несовмещение. Альтернативно, дисплейное устройство 103 может выполнять обработку компенсации. Фиг. 59 является блок-схемой дисплейного устройства 103, которое выполняет обработку компенсации. Как показано на фиг. 59, дисплейное устройство 103 включает в себя приемный модуль 5901, процессор 5902 потоков, процессор 5903 сигналов и модуль 5904 вывода. Приемный модуль 5901 принимает мультиплексированные потоковые данные с различных носителей, таких как BD-ROM-диск, полупроводниковое запоминающее устройство, внешняя сеть и широковещательная волна, а также из устройства 102 воспроизведения, и передает принимаемые мультиплексированные потоковые данные в процессор 5902 потоков. Процессор 5902 потоков выделяет различные типы данных, такие как видео, аудио и графика, из мультиплексированных потоковых данных и передает различные типы данных в процессор 5903 сигналов. Процессор 5903 сигналов декодирует каждые из различных типов данных и передает результаты в модуль 5904 вывода. Модуль 5904 вывода преобразует каждые из декодированных данных в предварительно определенный формат и выводит результаты. Выводом модуля 5904 вывода является само видео/аудио. Альтернативно, выводом может быть видео/аудиосигнал в HDMI-формате. За исключением механических частей, таких как накопитель, дисплейная панель и динамик, элементы 5901, 5902, 5903 и 5904, показанные на фиг. 59, реализуются на одной или более интегральных схем.
(1-N-1) Горизонтальное несовмещение между видом для просмотра левым глазом и видом для просмотра правым глазом
Фиг. 60A является видом сверху, схематично показывающим горизонтальные углы обзора HAL и HAR для пары видеокамер CML и CMR, снимающих трехмерные видеоизображения. Как показано на фиг. 60A, пара видеокамер CML и CMR размещается рядом в горизонтальном направлении. Левая видеокамера CML снимает вид для просмотра левым глазом, и правая видеокамера CMR снимает вид для просмотра правым глазом. Горизонтальные углы обзора HAL и HAR видеокамер CML и CMR имеют идентичный размер, но отличаются по местоположению. Это дает в результате полосу AL, которая включена только в горизонтальный угол обзора HAL левой видеокамеры CML, и полосу AR, которая включена только в горизонтальный угол обзора HAR правой видеокамеры CMR. Объект OBC, расположенный в секции, общей для обоих горизонтальных углов обзора HAL и HAR, захватывается посредством обеих видеокамер CML и CMR. Тем не менее, объект OBL, расположенный в полосе AL, которая включена только в горизонтальный угол обзора HAL левой видеокамеры CML, захватывается только посредством левой видеокамеры CML, а объект OBR, расположенный в полосе AR, которая включена только в горизонтальный угол обзора HAR правой видеокамеры CMR, захватывается только посредством правой видеокамеры CMR.
Фиг. 60B является схематичным представлением, показывающим вид LV для просмотра левым глазом, снимаемый посредством левой видеокамеры CML, а фиг. 60C является схематичным представлением, показывающим вид RV для просмотра правым глазом, захватываемый посредством правой видеокамеры CMR. Как показано на фиг. 60B и 60C, полоса AL, которая включена только в горизонтальный угол обзора HAL левой видеокамеры CML, выглядит как полоса вдоль левого края вида LV для просмотра левым глазом. Тем не менее, эта полоса AL не включена в вид RV для просмотра правым глазом. С другой стороны, полоса AR, которая включена только в горизонтальный угол обзора HAR правой видеокамеры CMR, выглядит как полоса вдоль правого края вида RV для просмотра правым глазом. Тем не менее, эта полоса AR не включена в вид LV для просмотра левым глазом. Соответственно, для трех объектов OBL, OBC и OBR, показанных на фиг. 60A, объект справа OBR не включен в вид LV для просмотра левым глазом, а объект слева OBL не включен в вид RV для просмотра правым глазом. Как результат, объект слева OBL является видимым только для левого глаза зрителя, а объект справа OBR является видимым только для правого глаза. Вид LV для просмотра левым глазом и вид RV для просмотра правым глазом тем самым приводят к риску возникновения чувства некомфортности у зрителей.
На BD-ROM-диске 101, информация, указывающая ширину WDH вышеуказанных полос AL и AR, включенных в каждый кадр вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, хранится в видеопотоке для воспроизведения зависимого вида. Эта информация хранится в дополнительных данных VAU в начале каждой видеопоследовательности. Тем не менее, следует отметить, что эти дополнительные данные отличаются от дополнительных данных, включающих в себя метаданные 1110 смещения, показанные на фиг. 11. С другой стороны, в устройстве 102 воспроизведения, декодер 4225 системных целевых объектов считывает информацию, показывающую ширину WDH вышеуказанных полос AL и AR, из видеопотока для воспроизведения зависимого вида. Кроме того, декодер 4225 системных целевых объектов передает эту информацию в модуль 4710 формирования параллактического видео в сумматоре 4226 плоскостей или модуль 5904 вывода в дисплейном устройстве 103. Когда приемный модуль 5901 в дисплейном устройстве 103 непосредственно считывает трехмерное видеосодержимое с носителя информации, такого как BD-ROM-диск, вышеуказанная информация считывается из видеопотока для воспроизведения зависимого вида и передается в модуль 5904 вывода посредством процессора 5903 сигналов в дисплейном устройстве 103. Модуль 4710 формирования параллактического видео или модуль 5904 вывода (в дальнейшем в этом документе, называемый "модулем 4710 формирования параллактического видео и т.д.") обращается к этой информации, чтобы обрабатывать левую видеоплоскость и правую видеоплоскость, равномерно раскрашивая полосы AL и AR в цвет фона или черный цвет. Другими словами, пикселные данные, включенные в полосы AL и AR, равномерно перезаписываются с данными, которые представляют цвет фона или черный цвет.
Фиг. 60D и 60E являются принципиальными схемами, соответственно, показывающими вид LV для просмотра левым глазом, представленный посредством обработанной левой видеоплоскости, и вид RV для просмотра правым глазом, представленный посредством обработанной правой видеоплоскости. Как показано на фиг. 60D, полоса AL, которая включается только в горизонтальный угол обзора HAL левой видеокамеры CML, скрыта посредством черной полосы BL ширины WDH. С другой стороны, как показано на фиг. 60E, полоса AR, которая включена только в горизонтальный угол обзора HAR правой видеокамеры CMR, скрыта посредством черной полосы BR ширины WDH. Как результат, оба глаза зрителя видят только область, совместно используемую посредством вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, что исключает риск возникновения чувства некомфортности у зрителей.
Кроме того, модуль 4710 формирования параллактического видео и т.д. может выполнять кадрирование, аналогичное кадрированию, показанному на фиг. 47, чтобы удалять пикселные данные, включенные во внешнюю половину полос AL и AR, соответственно, расположенных в левой и правой видеоплоскости. В этом случае, модуль 4710 формирования параллактического видео и т.д. равномерно раскрашивает оставшуюся половину полос AL и AR в цвет фона или черный цвет и, помимо этого, добавляет цвет фона или черную полосу в половину ширины полос AL и AR на противоположной стороне. Таким образом, оба глаза зрителя видят область, совместно используемую посредством вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, в центре экрана, с цветом фона или черными полосами в обоих краях экрана. Это исключает риск возникновения чувства некомфортности у зрителей.
Альтернативно, модуль 4710 формирования параллактического видео и т.д. может обрабатывать левую и правую видеоплоскость следующим образом. Во-первых, через кадрирование, аналогичное кадрированию, показанному на фиг. 49, модуль 4710 формирования параллактического видео и т.д. удаляет пикселные данные в полосах AL и AR из каждой из видеоплоскостей. Затем, модуль 4710 формирования параллактического видео и т.д. изменяет размеры каждой видеоплоскости из пикселных данных в оставшейся области через масштабирование. Видеоизображение, показанное посредством оставшейся области, тем самым расширяется, чтобы заполнять весь кадр. Как результат, оба глаза зрителя видят только область, совместно используемую посредством вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, что исключает риск возникновения чувства некомфортности у зрителей.
(1-N-2) Вертикальное несовмещение между видом для просмотра левым глазом и видом для просмотра правым глазом
Фиг. 61A является видом сверху, схематично показывающим вертикальные углы обзора VAL и VAR для пары видеокамер CML и CMR, снимающих трехмерные видеоизображения. Как показано на фиг. 61A, вертикальные углы обзора VAL и VAR для видеокамер CML и CMR имеют идентичный размер, но отличаются по местоположению. Это дает в результате полосу AT, которая включена только в вертикальный угол обзора VAL левой видеокамеры CML, и полосу AB, которая включена только в вертикальный угол обзора VAR правой видеокамеры CMR. Объект OBJ, расположенный в секции, общей для обоих вертикальных углов обзора VAL и VAR, захватывается посредством обеих видеокамер CML и CMR. Тем не менее, объекты, расположенные в полосе AT, которая включена только в вертикальный угол обзора VAL левой видеокамеры CML, захватываются только посредством левой видеокамеры CML, а объекты, расположенные в полосе AB, которая включена только в вертикальный угол обзора VAR правой видеокамеры CMR, захватываются только посредством правой видеокамеры CMR.
Фиг. 61B является схематичным представлением, показывающим вид LV для просмотра левым глазом, снимаемый посредством левой видеокамеры CML, и вид RV для просмотра правым глазом, снимаемый посредством правой видеокамеры CMR. Как показано на фиг. 61B, полоса AT, которая включена только в вертикальный угол обзора VAL левой видеокамеры CML, выглядит как полоса вдоль начала вида LV для просмотра левым глазом. Тем не менее, эта полоса AT не включена в вид RV для просмотра правым глазом. С другой стороны, полоса AB, которая включена только в вертикальный угол обзора VAR правой видеокамеры CMR, выглядит как полоса вдоль нижнего края вида RV для просмотра правым глазом. Тем не менее, эта полоса AB не включена в вид LV для просмотра левым глазом. Следует отметить, что позиции полос AT и AB могут быть изменены на противоположные между видом LV для просмотра левым глазом и видом RV для просмотра правым глазом. Таким образом, когда вид LV для просмотра левым глазом и вид RV для просмотра правым глазом отличаются относительно включения полос AT и AB, вертикальная позиция объекта OBJ, показанного на фиг. 61A отличается между видом LV для просмотра левым глазом и видом RV для просмотра правым глазом на высоту HGT полос AT и AB. Как результат, вертикальная позиция объекта OBJ отличается при просмотре посредством левого глаза и правого глаза зрителя, что имеет риск возникновения чувства некомфортности у зрителей.
На BD-ROM-диске 101, информация, указывающая высоту HGT вышеуказанных полос AT и AB, включенных в каждый кадр вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, хранится в видеопотоке для воспроизведения зависимого вида. Эта информация хранится в дополнительных данных VAU в начале каждой видеопоследовательности. Тем не менее, следует отметить, что эти дополнительные данные отличаются от дополнительных данных, включающих в себя метаданные 1110 смещения, показанные на фиг. 11. С другой стороны, в устройстве 102 воспроизведения, декодер 4225 системных целевых объектов считывает информацию, указывающую высоту HGT вышеуказанных полос AT и AB, из видеопотока для воспроизведения зависимого вида. Кроме того, декодер 4225 системных целевых объектов передает эту информацию в модуль 4710 формирования параллактического видео в сумматоре 4226 плоскостей или модуль 5904 вывода в дисплейном устройстве 103. Когда приемный модуль 5901 в дисплейном устройстве 103 непосредственно считывает трехмерное видеосодержимое с носителя информации, такого как BD-ROM-диск, вышеуказанная информация считывается из видеопотока для воспроизведения зависимого вида и передается в модуль 5904 вывода посредством процессора 5903 сигналов в дисплейном устройстве 103.
Модуль 4710 формирования параллактического видео или модуль 5904 вывода (в дальнейшем в этом документе, называемый "модулем 4710 формирования параллактического видео и т.д.") обращается к высоте HGT полос AT и AB, чтобы обрабатывать левую видеоплоскость и правую видеоплоскость следующим образом. Во-первых, модуль 4710 формирования параллактического видео и т.д. сдвигает позицию пикселных данных в левой видеоплоскости наполовину высоты HGT, т.е. HGT/2, и сдвигает позицию пикселных данных в правой видеоплоскости вниз на HGT/2. Вертикальный центр видеоизображения, показанного в области видеоплоскостей, отличной от полос AT и AB, тем самым совпадает с вертикальным центром экрана. В левой видеоплоскости половина полосы AT удаляется с начала, давая в результате пустую полосу с высотой в HDT/2 в конце. В правой видеоплоскости половина полосы AB удаляется из нижней части, давая в результате пустую полосу с высотой HDT/2 в верхней части. Затем, модуль 4710 формирования параллактического видео и т.д. равномерно раскрашивает полосы цветом фона или черным цветом. Другими словами, пикселные данные, включенные в полосы, равномерно перезаписываются с данными, которые представляют цвет фона или черный цвет.
Фиг. 61C является принципиальной схемой, показывающей вид LV для просмотра левым глазом, представленный посредством обработанной левой видеоплоскости, и вид RV для просмотра правым глазом, представленный посредством обработанной правой видеоплоскости. Как показано на фиг. 61C, вертикальные центры вида LV для просмотра левым глазом и вида RV для просмотра правым глазом совпадают. Соответственно, вертикальная позиция объекта OBJ, показанного на фиг. 61A, является идентичной в виде LV для просмотра левым глазом и виде RV для просмотра правым глазом. Вверху вида LV для просмотра левым глазом полоса AT, которая включается только в вертикальный угол обзора VAL левой видеокамеры CML, скрыта посредством черной полосы BT высоты HGT/2, а внизу вида RV для просмотра правым глазом полоса AB, которая включается только в вертикальный угол обзора VAR правой видеокамеры CMR, скрыта посредством черной полосы BB высоты HGT/2. Кроме того, черная полоса BB высоты HGT/2 добавляется к нижней части вида LV для просмотра левым глазом, и черная полоса BT высоты HGT/2 добавляется к верхней части вида RV для просмотра правым глазом. Как результат, оба глаза зрителя видят только область, совместно используемую посредством вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, и вертикальные позиции совпадают между объектом, видимым посредством каждого глаза. Это исключает риск возникновения чувства некомфортности у зрителей.
Альтернативно, модуль 4710 формирования параллактического видео и т.д. может обрабатывать левую и правую видеоплоскость следующим образом. Во-первых, через кадрирование, аналогичное кадрированию, показанному на фиг. 49, сумматор 4126 плоскостей удаляет пикселные данные в полосах AT и AB из каждой из видеоплоскостей. Затем, модуль 4710 формирования параллактического видео и т.д. изменяет размеры каждой видеоплоскости из пикселных данных в оставшейся области через масштабирование. Видеоизображение, показанное посредством оставшейся области, тем самым расширяется, чтобы заполнять весь кадр, и как результат, оба глаза зрителя видят только область, совместно используемую посредством вида LV для просмотра левым глазом и вида RV для просмотра правым глазом. Кроме того, вертикальные позиции совпадают между объектом, видимым посредством каждого глаза. Это исключает риск возникновения чувства некомфортности у зрителей.
(1-N-3) Несовмещение графических изображений между видом для просмотра левым глазом и видом для просмотра правым глазом
Когда устройство воспроизведения в режиме 1 плоскости+смещения предоставляет большое смещение для графической плоскости, чтобы формировать пару графических плоскостей, область на правом или левом краю одной графической плоскости не может быть включена на правый или левый край другой графической плоскости.
Фиг. 62A является схематичным представлением, показывающим пример графических изображений, представленных посредством графической плоскости GPL. Как показано на фиг. 62A, графическая плоскость GPL представляет три типа графических элементов OB1, OB2 и OB3. В частности, левый край левого графического элемента OB1 находится на расстоянии D1 от левого края графической плоскости GPL, а правый край правого графического элемента OB3 находится на расстоянии D3 от правого края графической плоскости GPL. Фиг. 62B и 62C являются принципиальными схемами, соответственно, показывающими процессы предоставления смещения вправо и влево для графической плоскости GPL. Как показано на фиг. 62B, полоса AR1 ширины OFS, равной значению смещения, удаляется из правого края графической плоскости GPL, и прозрачная полоса AL1 ширины OFS добавляется к левому краю способом, аналогичным процессу кадрирования, показанному на фиг. 49. Горизонтальные позиции графических элементов OB1-OB3 тем самым сдвигаются вправо от своих исходных позиций на расстояние OFS, равное значению смещения. С другой стороны, как показано на фиг. 62B, полоса AL2 ширины OFS, равной значению смещения, удаляется из левого края графической плоскости GPL, и прозрачная полоса AR2 ширины OFS добавляется к правому краю. Горизонтальные позиции графических элементов OB1-OB3 тем самым сдвигаются влево от их исходных позиций на расстояние OFS.
Как показано на фиг. 62B и 62C, расстояние OFS, которое равно значению смещения, превышает расстояние D1 между левым краем левого графического элемента OB1 и левым краем графической плоскости GPL. Расстояние OFS также превышает расстояние D3 между правым краем правого графического элемента OB3 и правым краем графической плоскости GPL. Соответственно, часть MP3 правого края правого графического элемента OB3 отсутствует в графической плоскости GP1, в которую предоставлено смещение вправо. Кроме того, часть MP1 левого края левого графического элемента OB1 отсутствует в графической плоскости GP2, в которую предоставлено смещение влево. Тем не менее, пропущенная часть MP1 левого графического элемента OB1 включена в графическую плоскость GP1 со смещением вправо, а пропущенная часть MP3 правого графического элемента OB3 включена в графическую плоскость GP2 со смещением влево. Как результат, эти пропущенные части MP1 и MP3 видны только посредством одного из глаз зрителя, что может вызывать чувство некомфортности у зрителей.
В устройстве 102 воспроизведения, каждый из модулей 4731-4734 кадрирования в сумматоре 4226 плоскостей обращается к информации 4707 смещения, чтобы выполнять управление смещением для графической плоскости GPL. Здесь, каждый из модулей 4731-4734 кадрирования, помимо этого, удаляет полосу, которая имеет ширину, равную значению смещения, и идет вдоль левого или правого края графической плоскости GPL. Другими словами, пикселные данные в полосе перезаписываются с данными, представляющими прозрачный цвет. Альтернативно, модуль 5904 вывода в дисплейном устройстве 103 может принимать информацию смещения из декодера 4225 системных целевых объектов или процессора 5903 сигналов в дисплейном устройстве 103 и обращаться к информации смещения, чтобы удалять полосу из левого или правого края графической плоскости GPL. Фиг. 62B и 62C показывают полосы AS1 и AS2, которые должны быть удалены. В графической плоскости GP1 со смещением вправо полоса AS1, которая должна быть удалена, включает в себя пропущенную часть MP1 левого графического элемента OB1. В графической плоскости GP2 со смещением влево полоса AS2, которая должна быть удалена, включает в себя пропущенную часть MP3 правого графического элемента OB3.
Фиг. 62D и 62E являются схематичными представлениями, показывающими графические изображения, представленные посредством графических плоскостей GP1 и GP2, со смещениями вправо и влево, соответственно. Как показано на фиг. 62D и 62E, в графических плоскостях GP1 и GP2, формы трех типов графических элементов OB1-OB3 совпадают. Как результат, только совместно используемая часть графических изображений видима каждому из глаз зрителя. Это исключает риск возникновения чувства некомфортности у зрителей.
Альтернативно, следующее условие может быть предписано касательно компоновки графических элементов для графических плоскостей, воспроизводимых из PG-потока или IG-потока на BD-ROM-диске, и для графической плоскости, сформированной посредством устройства 102 воспроизведения. Фиг. 63 является принципиальной схемой, показывающей такое условие. Как показано на фиг. 63, ортогональные координаты XY устанавливаются на графической плоскости GPL, с началом координат (0, 0) в левом верхнем углу. Координаты X и Y - это, соответственно, горизонтальные и вертикальные координаты графической плоскости GPL. Координаты правого нижнего угла графической плоскости GPL задаются равными (TWD, THG). С помощью этих координат XY, условие задается следующим образом: в каждом кадре графические элементы OB1, OB2 и OB3 должны размещаться в рамках прямоугольной области, имеющей четыре точки (OFS, 0), (OFS TWD, 0), (OFS TWD, THG) и (OFS, THG) в качестве вершин. Другими словами, не допускается размещение графических элементов в рамках полос AL и AR ширины OFS, которые, соответственно, идут вдоль левого края и правого края графической плоскости GPL. Как очевидно из фиг. 62B и 62C, эти полосы AL и AR удаляются посредством управления смещением. Соответственно, если не допускается размещение графических элементов в рамках полос AL и AR, формы графических элементов не изменяются, даже когда смещение предоставляется в графическую плоскость GPL. Как результат, оба глаза зрителя видят идентичные графические изображения, что исключает риск возникновения чувства некомфортности у зрителей.
(1-O) Отображение в формате "почтовый ящик"
Размер экрана, предполагаемый во время авторинга видеосодержимого, зависит от формата содержимого: формат Full-HD, приспосабливаемый в цифровом телевизионном вещании; или широкоэкранный формат, приспосабливаемый в фильмах. Соотношение сторон формата Full-HD составляет 16:9 (~1,78:1), в то время как соотношение сторон формата широкоэкранного кино составляет 2,35:1. Соответственно, в домашнем киносодержимом, записанном на BD-ROM-дисках, горизонтальные черные полосы предоставляются выше и ниже каждого видеокадра. Черные полосы предоставляются так, что общее соотношение сторон видеокадра и черных полос регулируется до 16:9. Этот способ отображения упоминается как "отображение в формате "почтовый ящик".
Фиг. 64A1 и 64A2 являются принципиальными схемами, показывающими один экран при отображении в формате "почтовый ящик". Как показано на фиг. 64A1 и 64A2, разрешение всего экрана составляет 1920x1080 пикселов, а соотношение сторон составляет 16:9. С другой стороны, разрешение области DRG отображения для отображения видеоизображений составляет 1920x818 пикселов, а соотношение сторон составляет 2,35:9. Черные полосы BT и BB, каждая из которых имеет высоту в 131 пиксел, идут горизонтально выше и ниже области DRG отображения.
Когда такое отображение в формате "почтовый ящик" приспосабливается при отображении трехмерных видеоизображений, предпочтительно, чтобы субтитр отображался на любой из черных полос BT и BB, а не в области DRG отображения. Это предоставляет возможность отделения трехмерных видеоизображений и субтитра друг от друга и их представления зрителю надежным способом. Тем не менее, 131 пиксел для высоты черных полос BT и BB необязательно является достаточным для того, чтобы отображать субтитр. В этом случае, сумматоры 4226 плоскостей устройства 102 воспроизведения предоставляют для плоскости первичного видео смещение в вертикальном направлении. Это управление смещением упоминается как "сдвиг видео". Предусмотрено три типа сдвигов видео: "без изменения", сдвиг вверх" и "сдвиг вниз". В режиме без изменения для плоскости первичного видео не предоставляется смещение в вертикальном направлении. Таким образом, как в видеокадре, показанном на фиг. 64A1 и 64A2, высота каждой из черных полос BT и BB поддерживается равной 131 пиксел. В режиме сдвига вверх плоскость первичного видео содержит смещение вверх. Фиг. 64B является принципиальной схемой, показывающей экран, на котором плоскость первичного видео содержит смещение вверх в 131 пиксел. Как показано на фиг. 64B, черная полоса BT удалена из верхней части, и высота черной полосы BB в нижней части увеличена в два раза. В режиме сдвига вниз плоскость первичного видео содержит смещение вниз. Фиг. 64C является принципиальной схемой, показывающей экран, на котором плоскость первичного видео содержит смещение вниз в 131 пиксел. Как показано на фиг. 64C, черная полоса BB удалена из нижней части, и высота черной полосы BT в верхней части увеличена в два раза. Таким образом, сумматоры 4226 плоскостей увеличивают любую из черных полос BT и BB до высоты, достаточной для того, чтобы отображать субтитр посредством выполнения сдвига видео в режиме сдвига вверх или вниз.
Размер вертикального смещения может быть отличным от 131 пиксела. Фиг. 64D является принципиальной схемой, показывающей экран, на котором плоскость первичного видео содержит смещение вверх в 51 пиксел. Как показано на фиг. 64D, высота черной полосы BT в верхней части уменьшена до 131-51=80 пикселов, а высота черной полосы BB в нижней части увеличена до 131+51=182 пиксела. Далее предполагается, что размер смещения составляет 131 пиксел.
Фиг. 65 является функциональной блок-схемой, показывающей структуру устройства 102 воспроизведения, требуемую для сдвига видео. Структура, показанная на фиг. 65, в отличие от структуры, показанной на фиг. 47, включает в себя модуль 6501 сдвига видео, SPRM(32) 6502 и SPRM(33) 6503. Другие компоненты являются аналогичными. На фиг. 65, компоненты, аналогичные компонентам, показанным на фиг. 47, отмечаются с помощью идентичных ссылок с номерами. Кроме того, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 47.
Значения, указываемые посредством SPRM(32) и SPRM(33), задаются посредством модуля 4234 выполнения программ в соответствии с прикладной программой, такой как BD-J-объект, или инструкцией пользователя через GUI. Значение, указываемое посредством SPRM(33), дополнительно обновляется в соответствии с файлом списков воспроизведения.
Фиг. 66A является таблицей, показывающей структуры данных SPRM(32) и SPRM(33). Как показано на фиг. 66A, SPRM(32) сохраняет параметр, который указывает режим сдвига видео (video_shift_mode). Параметр может принимать любое из трех значений "0", "1" и "2", которые соответствуют трем типам режимов сдвига видео. SPRM(33) сохраняет четыре пары из значения сдвига вверх видео и значения сдвига вниз видео. Значения сдвига состоят из следующего: пара для PG-плоскости (PG_shift_value_for_Up, PG_shift_value_for_Down); пара для IG-плоскости (IG_shift_value_for_Up, IG_shift_value_for_Down); пара для плоскости вторичного видео (SV_shift_value_for_Up, SV_shift_value_for_Down); и пара для плоскости изображений (IM_shift_value_for_Up, IM_shift_value_for_Down). Каждое из значения сдвига вверх видео и значения сдвига вниз видео представляет размер смещения в вертикальном направлении, которое предоставляется для PG-плоскости и т.п., когда смещение вверх или вниз предоставляется для плоскости первичного видео.
Фиг. 66B является принципиальной схемой, показывающей STN-таблицу в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик". Как показано на фиг. 66B, в STN-таблице 6600, STN 6601 ассоциируется с записью 6602 потока для PG-потока 1 и информацией 6603 атрибутов потока. Информация 6603 атрибутов потока включает в себя значение 6610 сдвига вверх видео (PG_y_shift_value_for_Up) и значение 6611 сдвига вниз видео (PG_y_shift_value_for_Down). При такой структуре, эти значения сдвига могут задаваться для каждого PL. Относительно других потоковых данных, таких как IG-поток, каждое значение сдвига может задаваться. Модуль 4235 управления воспроизведением считывает значение сдвига из STN-таблицы в каждом PI и обновляет значение, указываемое посредством SPRM(33), на значение сдвига считывания.
Модуль 6501 сдвига видео принимает данные 4701 плоскости для просмотра левым глазом и данные 4702 плоскости для просмотра правым глазом поочередно из переключателя 4720. При каждом их приеме модуль 6501 сдвига видео обращается к SPRM(32) в модуле 4236 хранения переменных проигрывателя и предоставляет для плоскости первичного видео вертикальное смещение в режиме сдвига видео, указываемом посредством значения в SPRM(32). Модуль 6501 сдвига видео затем передает плоскость первичного видео во второй сумматор 4742.
Фиг. 67A-67C являются принципиальными схемами, показывающими плоскости VPA, VPB и VPC первичного видео, обрабатываемые посредством модуля 6501 сдвига видео в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно. Когда SPRM(32) указывает режим без изменения, модуль 6501 сдвига видео не предоставляет для плоскости первичного видео вертикальное смещение. Таким образом, как показано на фиг. 67B, высота каждой из черных полос BT и BB в плоскости VPB первичного видео поддерживается равной 131 пиксел. Когда SPRM(32) указывает режим сдвига вверх, модуль 6501 сдвига видео, аналогично процессу кадрирования, показанному на фиг. 49, сначала вырезает черную полосу BT, которая имеет высоту в 131 пиксел, из верхней части исходной плоскости VPB первичного видео. Модуль 6501 сдвига видео затем, как показано на фиг. 67A, добавляет черную полосу AB, которая имеет высоту в 131 пиксел, к нижней части плоскости VPA первичного видео. Это перемещает местоположение пикселных данных, отличных от пикселных данных, включенных в вырезанную черную полосу BT, вверх на 131 пиксел. С другой стороны, высота черных полос BB+AB увеличивается до 131×2=262 пикселов. Когда SPRM(32) указывает режим сдвига вниз, модуль 6501 сдвига видео вырезает черную полосу BB, которая имеет высоту в 131 пиксел, из нижней части исходной плоскости VPB первичного видео и, как показано на фиг. 67C, добавляет черную полосу AT, которая имеет высоту в 131 пиксел, к верхней части плоскости VPC первичного видео. Это перемещает местоположение пикселных данных, отличных от пикселных данных, включенных в вырезанную черную полосу, вниз на 131 пиксел. С другой стороны, высота черных полос BT+AT увеличивается до 131×2=262 пикселов.
Снова ссылаясь на фиг. 65, каждый раз, когда он принимает данные 4704 PG-плоскости из декодера 4225 системных целевых объектов, второй модуль 4732 кадрирования обращается к SPRM(32) 6502 и SPRM(33) 6503 и предоставляет для PG-плоскости 4704 вертикальное смещение в соответствии со значениями, сохраненными в SPRM. Кроме того, в режиме 1 плоскости+смещения, второй модуль 4732 кадрирования предоставляет для PG-плоскости 4704 горизонтальное смещение. Второй модуль 4732 кадрирования затем передает PG-плоскость 4704 во второй сумматор 4742.
Фиг. 67D-67F являются принципиальными схемами, показывающими PG-плоскости PGD, PGE и PGF, обрабатываемые посредством второго модуля 4732 кадрирования в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно. Когда SPRM(32) указывает режим без изменения, второй модуль 4732 кадрирования не предоставляет для PG-плоскости вертикальное смещение. Таким образом, как показано на фиг. 67E, субтитр SUB в PG-плоскости PGE поддерживается в исходной позиции. Когда SPRM(32) указывает режим сдвига вверх, второй модуль 4732 кадрирования сначала считывает значение "a" сдвига вверх видео (PG_shift_value_for_Up) для PG-плоскости из SPRM(33) 6503. Второй модуль 4732 кадрирования затем, аналогично процессу кадрирования, показанному на фиг. 49, предоставляет для PG-плоскости PGE смещение вниз, которое имеет размер, идентичный значению "a" сдвига вверх видео. Более конкретно, второй модуль 4732 кадрирования сначала вырезает полосу SBE, которая имеет высоту в "a" пикселов, из нижней части исходной PG-плоскости PGE. Второй модуль 4732 кадрирования затем, как показано на фиг. 67D, добавляет полосу STD, которая имеет высоту в "a" пикселов, к верхней части PG-плоскости PGD. Это перемещает местоположение субтитра SUB вниз на "a" пикселов. Когда SPRM(32) указывает режим сдвига вниз, второй модуль 4732 кадрирования сначала считывает значение "b" сдвига вниз видео (PG_shift_value_for_Down) для PG-плоскости из SPRM(33) 6503. Второй модуль 4732 кадрирования затем, аналогично процессу кадрирования, показанному на фиг. 49, предоставляет для PG-плоскости PGE смещение вверх, которое имеет размер, идентичный значению "b" сдвига вниз видео. Более конкретно, второй модуль 4732 кадрирования сначала вырезает полосу STE, которая имеет высоту в "b" пикселов, из верхней части исходной PG-плоскости PGE. Второй модуль 4732 кадрирования затем, как показано на фиг. 67F, добавляет полосу SBF, которая имеет высоту в "b" пикселов, к нижней части PG-плоскости PGF. Это перемещает местоположение субтитра SUB вверх на "b" пикселов.
Второй сумматор 4742 принимает данные PG-плоскости из второго модуля 4732 кадрирования, накладывает данные PG-плоскости на данные плоскости первичного видео из модуля 6501 сдвига видео и передает результат в третий сумматор 4743. Фиг. 67G-67I являются принципиальными схемами, показывающими данные PLG, PLH и PLI плоскости, комбинированные посредством второго сумматора 4742 в режиме сдвига вверх, режиме без изменения и режиме сдвига вниз, соответственно. В режиме без изменения, как показано на фиг. 67H, субтитр SUB отображается поверх изображений MVW первичного видео. В режиме сдвига вверх, как показано на фиг. 67G, субтитр SUB отображается в черной полосе BBG, которая находится ниже изображений MVW первичного видео. Это может быть реализовано посредством регулирования значения "a" сдвига вверх видео. В режиме сдвига вниз, как показано на фиг. 671, субтитр SUB отображается в черной полосе BTI, которая находится выше изображений MVW первичного видео. Это может быть реализовано посредством регулирования значения "b" сдвига вниз видео.
При отображении в формате "почтовый ящик" диалоговый экран, представленный посредством IG-плоскости, видеоизображения, представленные посредством плоскости вторичного видео, или всплывающее меню, представленное посредством плоскости изображений, может отображаться в черной полосе, как и субтитр, представленный посредством PG-плоскости. В этих случаях высота черной полосы может регулироваться надлежащим образом посредством способа, аналогичного вышеописанному способу.
(1-O-1) В структуре, показанной на фиг. 65, второй модуль 4732 кадрирования считывает значение сдвига вверх/вниз видео из SPRM(33) 6503. Альтернативно, второй модуль 4732 кадрирования может считывать значение сдвига вверх/вниз видео непосредственно из файла списков воспроизведения.
(1-O-2) Высота черных полос BT и BB может быть отличной от 131 пиксела и дополнительно может быть переменной. Ее значение может задаваться в SPRM в модуле 4236 хранения переменных проигрывателя в соответствии с прикладной программой или пользователем.
(1-O-3) На фиг. 67D и 67F, второй модуль 4732 кадрирования перемещает местоположение почти всех пикселных данных, включенных в PG-плоскость PGE, вверх и вниз. Альтернативно, PG-декодер может изменять позицию отображения объекта, указываемую посредством PCS, посредством обращения к SPRM(33) 6503. Например, когда PCS указывает позицию отображения объекта=(x, y), и SPRM(33) 6503 указывает значение "a" сдвига вверх видео, PG-декодер изменяет позицию отображения объекта на координаты (x, y+a). При этой операции, аналогично субтитру SUB, показанному на фиг. 67D, графический объект, представленный посредством PG-потока, отображается ниже позиции отображения объекта, указываемой посредством PCS. Это также применимо к случаю, когда позиция отображения графического объекта перемещается вверх. Следует отметить, что PCS может сохранять значение сдвига вверх/вниз видео.
(1-O-4) В режиме сдвига вверх и режиме сдвига вниз, как показано на фиг. 67D и 67F, верхние и нижние части PG-плоскости вырезаются. Здесь, чтобы не допускать вырезания верхних и нижних частей графического объекта, область, в которой может размещаться графический объект, может быть ограничена предварительно определенным диапазоном. В качестве конкретного примера, предполагается, что высота x ширина PG-плоскости составляет HGTxWDH, значение сдвига вверх видео составляет "a", а значение сдвига вниз видео составляет "b". В этом случае, как показано на фиг. 67E, компоновка графического объекта ограничена рамками следующей горизонтальной полосы: координаты X-Y верхнего левого угла PUL=(0, b); и координаты X-Y нижнего левого угла PDR=(WDH, HGT-a). Более точно, PG-поток удовлетворяет следующим условиям: (A) позиция отображения объекта, указываемая посредством PCS, находится в рамках вышеописанной полосы; (B), даже если графический объект отображается в позиции отображения объекта, область отображения не превышает диапазон вышеописанной полосы; (C) позиция окна, указываемая посредством WDS, находится в рамках вышеописанной полосы; и (D), даже если окно задается в позиции окна, его диапазон не превышает диапазон вышеописанной полосы. Таким образом, можно не допускать вырезания верхних и нижних частей графического объекта.
(1-O-5) Фиг. 68A является принципиальной схемой, показывающей другой пример STN-таблицы в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик". Как показано на фиг. 68A, в STN-таблице 6800, STN 6801 ассоциируется с записью 6802 потока для PG-потока 1 и информацией 6803 атрибутов потока. Информация 6803 атрибутов потока включает в себя режим 6812 сдвига видео, а также значение 6810, 6811 сдвига вверх/вниз видео. В этом случае, устройство 102 воспроизведения может использовать следующую структуру для сдвига видео.
Фиг. 69 является функциональной блок-схемой, показывающей другой пример структуры устройства 102 воспроизведения, требуемой для сдвига видео. Структура, показанная на фиг. 69, отличается от структуры, показанной на фиг. 65, модулем 6901 сдвига видео и SPRM(34) 6904. Другие компоненты являются аналогичными. На фиг. 69, компоненты, аналогичные компонентам, показанным на фиг. 65, отмечаются с помощью идентичных ссылок с номерами. Кроме того, подробности аналогичных компонентов могут быть обнаружены в описании на фиг. 65.
Как показано на фиг. 66A, SPRM(32) представляет режим сдвига видео, а SPRM(33) представляет значение сдвига вверх видео и значение сдвига вниз видео. Параметры, представляющие их, обновляются в соответствии с STN-таблицей в файле списков воспроизведения, как показано на фиг. 68A. В модуле 4236 хранения переменных проигрывателя, SPRM(34) дополнительно сохраняет флаг, состояние пометки/снятия которого указывает то, должен или нет выполняться сдвиг видео. Значение флага задается посредством модуля 4234 выполнения программ в соответствии с прикладной программой или пользователем. Каждый раз, когда он принимает либо данные левой видеоплоскости 4701, либо данные правой видеоплоскости 4702 из переключателя 4720, модуль 6901 сдвига видео сначала обращается к флагу в SPRM(34), чтобы определять то, выполнять или нет сдвиг видео. Например, когда значение флага равно "1", модуль 6901 сдвига видео обращается к SPRM(32) и предоставляет для плоскости первичного видео вертикальное смещение в режиме сдвига видео, указываемом посредством значения в SPRM(32). С другой стороны, когда значение флага равно "0", модуль 6901 сдвига видео передает плоскость первичного видео во второй сумматор 4742 без выполнения сдвига видео. Аналогично, каждый раз, когда он принимает данные 4704 PG-плоскости из декодера 4225 системных целевых объектов, второй модуль 4732 кадрирования сначала обращается к SPRM(34), чтобы определять то, предоставлять или нет для PG-плоскости 4704 вертикальное смещение. Например, когда значение флага равно "1", второй модуль 4732 кадрирования обращается к SPRM(32) и SPRM(33) и предоставляет для PG-плоскости 4704 вертикальное смещение в соответствии с их значениями. С другой стороны, когда значение флага равно "0", второй модуль 4732 кадрирования не предоставляет для PG-плоскости 4704 вертикальное смещение.
(1-O-6) Когда множество фрагментов информации 6803 атрибутов потока, каждый из которых включает в себя режим 6812 сдвига видео, показанный на фиг. 68A, зарегистрированы в STN-таблице, порядок регистрации устанавливается так, что фрагменты информации атрибутов потока, имеющие идентичный режим сдвига видео, становятся непрерывными. Фиг. 68B является принципиальной схемой, показывающей порядок регистрации. Как показано на фиг. 68B, PID девяти PG-потоков 1-9 зарегистрированы в STN-таблице, в соответствии номерам потоков (STN) 5-13. Режим сдвига видео PG-потоков 1-3 задается как режим без изменения, режим сдвига видео PG-потоков 4 и 5 задается как режим сдвига вверх, а режим сдвига видео PG-потоков 6-9 задается как режим сдвига вниз. В этом случае, непрерывные три STN=1-3 назначаются PG-потокам 1-3, непрерывные два STN=4, 5 назначаются PG-потокам 4, 5, и непрерывные четыре STN=6-9 назначаются PG-потокам 6-9. Каждый раз, когда принимает уведомление относительно нажатия кнопки переключения субтитра с пульта 105 дистанционного управления, устройство 102 воспроизведения выбирает PG-поток, который должен использоваться при отображении субтитра, из PG-потоков 1-9 в соответствии с порядком регистрации, указываемым на фиг. 68B. Здесь, поскольку экран как видеоизображений, так и субтитра продолжается во время операции выбора, в общем, позиции отображения видеоизображений и субтитра изменяются, когда кнопка переключения субтитра нажимается. Тем не менее, как показано на фиг. 68B, PG-потоки с идентичным режимом сдвига видео непрерывно регистрируются в STN-таблице. Таким образом, в общем, позиции отображения видеоизображений и субтитра изменяются только после того, как кнопка переключения субтитра нажимается многократно. Таким образом, частота изменения подавляется, тем самым не допуская нарушения отображения видеоизображений и субтитра посредством операции выбора PG-потока.
(1-O-7) При переключении между режимами сдвига видео устройство 102 воспроизведения может изменять позицию отображения видеоизображений и субтитра плавно посредством использования визуальных эффектов, таких как выход из затемнения/затемнение. Более предпочтительно, изменение позиции отображения субтитра задерживается относительно изменения позиции отображения видеоизображений. Это предотвращает риск того, что изменение позиции отображения видеоизображений и субтитра вследствие переключения между режимами сдвига видео может вызывать чувство некомфортности у зрителей.
(1-O-8) В PDS в PG-потоке, "бесцветный прозрачный" назначается идентификатору цвета=255, а в WDS идентификатор цвета=255 назначается цвету фона в окне. Соответственно, когда PG-поток представляет субтитр, цвет фона субтитра задается как бесцветный прозрачный. Фиг. 70B является принципиальной схемой, показывающей видеоизображение IMG и субтитр SUB, отображаемые на экране SCR в этом случае. Как показано на фиг. 70B, в окне WIN1, указывающем диапазон отображения субтитра SUB, цвет фона является бесцветным прозрачным. Соответственно, в окне WIN1, видеоизображение IMG и субтитр SUB отображаются поверх друг друга.
С другой стороны, устройство 102 воспроизведения может назначать непрозрачный цвет, такой как черный, идентификатору цвета=255. Фиг. 70A является принципиальной схемой, показывающей структуру данных SPRM(37) в модуле 4236 хранения переменных проигрывателя. Как показано на фиг. 70A, значение цветовых координат цвета фона субтитра сохраняется в SPRM(37). Значение предварительно устанавливается посредством модуля 4234 выполнения программ в соответствии с прикладной программой или пользователем. Когда значение цветовых координат задается в SPRM(37), PG-декодер в декодере 4225 системных целевых объектов назначает значение цветовых координат идентификатору цвета=255 независимо от задания, указываемого посредством PDS. Фиг. 70C является принципиальной схемой, показывающей видеоизображение IMG и субтитр SUB, отображаемые на экране SCR в этом случае. Здесь, значение цветовых координат, указываемое посредством SPRM(37), является непрозрачным цветом, таким как черный цвет. Как показано на фиг. 70C, в окне WIN2, указывающем диапазон отображения субтитра SUB, цвет фона является непрозрачным цветом. Соответственно, в окне WIN2, видеоизображение IMG скрыто посредством цвета фона, и только субтитр SUB отображается. Таким образом, можно представлять видеоизображения и субтитр зрителю надежным способом.
(1-O-9) С помощью переключения между режимами сдвига видео, может изменяться не только позиция отображения графического изображения, представленного посредством PG-потока, но и сам PG-поток. Фиг. 71A является принципиальной схемой, показывающей еще один другой пример STN-таблицы в файле списков воспроизведения для видеосодержимого отображения в формате "почтовый ящик". Как показано на фиг. 71A, в STN-таблице 7100 STN 7101 ассоциируется с записью 7102 потока для PG-потока 1 и информацией 7103 атрибутов потока. Информация 7103 атрибутов потока включает в себя значение 7110, 7111 сдвига вверх/вниз видео. Значение 7110 сдвига вверх видео и значение 7111 сдвига вниз видео указывает PID PG-потоков, которые должны выбираться, когда режим сдвига вверх и режим сдвига вниз выбираются в качестве режима сдвига видео, соответственно. В PG-потоках, указываемых посредством значения 7110 сдвига вверх видео и значения 7111 сдвига вниз видео, первоначально позиция отображения субтитра задается в каждой черной полосе нижних и верхних частей плоскости первичного видео. В этом случае, устройство 102 воспроизведения может использовать следующую структуру для сдвига видео.
Фиг. 71B является функциональной блок-схемой, показывающей еще один другой пример структуры устройства 102 воспроизведения, требуемой для сдвига видео. Структура, показанная на фиг. 71B, отличается от структуры, показанной на фиг. 65, в следующих аспектах: (A) каждый раз, когда режим сдвига видео переключается, модуль 7135 управления воспроизведением указывает PID PG-потока, который должен выбираться заново, в PG-декодер 4072; (B) второй модуль 4732 кадрирования не предоставляет для PG-плоскости 4704 вертикальное смещение; (C) SPRM(33) и SPRM(34) могут не задаваться в модуле 4236 хранения переменных проигрывателя. Другие компоненты являются идентичными. Таким образом, на фиг. 71B, компонентам, которые также показаны на фиг. 65, назначаются идентичные ссылки с номерами. Кроме того, сведения по этим компонентам могут быть обнаружены в описании фиг. 65.
Режим сдвига видео, указываемый посредством SPRM(32) 6502, изменяется посредством модуля 4234 выполнения программ в соответствии с прикладной программой или пользователем. Каждый раз, когда он обнаруживает изменение значения, сохраненного в SPRM(32) 6502, модуль 7135 управления воспроизведением обращается к STN-таблице, показанной на фиг. 71A. За счет этого, модуль 7135 управления воспроизведением извлекает PID PG-потока, соответствующего режиму сдвига видео после изменения, и передает PID в PG-декодер 4072. Более конкретно, когда SPRM(32) 6502 указывает режим сдвига вверх, модуль 7135 управления воспроизведением извлекает PID, указываемый посредством субтитра 7110 перемещения вверх видео; когда SPRM(32) 6502 указывает режим сдвига вниз, модуль 7135 управления воспроизведением извлекает PID, указываемый посредством субтитра 7111 перемещения вниз видео; и когда SPRM(32) 6502 указывает режим без изменения, модуль 7135 управления воспроизведением извлекает PID, указываемый посредством записи 7102 потока. Как результат, PG-плоскость 4704, декодированная посредством PG-декодера 4072, представляет субтитр, который соответствует режиму сдвига видео.
Фиг. 72A является принципиальной схемой, показывающей субтитры SB1 и SB2, которые соответствуют режиму без изменения. Фиг. 72B является принципиальной схемой, показывающей субтитры SB1 и SB2, которые соответствуют режиму сдвига вниз. Как показано на фиг. 72A, в режиме без изменения горизонтальный субтитр SB1 отображается поверх нижней части области VP1 отображения видеоизображений, а вертикальный субтитр SB2 отображается поверх правой части области VP1 отображения видеоизображений. Кроме того, черные полосы BT и BB, которые имеют высоту в 131 пиксел, отображаются в частях выше и ниже области VP1 отображения видеоизображений, соответственно. Как показано на фиг. 72B, в режиме сдвига вниз черная полоса BT2, которая имеет высоту в 262 пиксела, отображается в части выше области VP2 отображения видеоизображений. Если позиция отображения горизонтального субтитра SB1 перемещена в черную полосу BT2 верхней части посредством предоставления для PG-плоскости вертикального смещения, то позиция отображения вертикального субтитра SB2 должна перемещаться вверх за пределы экрана в позицию SB20 отображения. С другой стороны, PG-поток, указываемый посредством субтитра 7111 перемещения вниз видео, представляет горизонтальный субтитр SBD, и позиция его отображения задана в черной полосе BT2 в верхней части заранее. Соответственно, модуль 7135 управления воспроизведением изменяет PG-поток, который представляет горизонтальный субтитр SB1 в режиме без изменения, на PG-поток, указываемый посредством субтитра 7111 перемещения вниз видео в режиме сдвига вниз. С другой стороны, модуль 7135 управления воспроизведением использует PG-поток, который представляет вертикальный субтитр SB2 в режиме без изменения, как если он находится в режиме сдвига вниз. При такой структуре, в режиме сдвига вниз, как показано на фиг. 72B, горизонтальный субтитр SBD отображается в черной полосе BT2 в верхней части, а вертикальный субтитр SB2 отображается, как в режиме без изменения, поверх правой части области VP1 отображения видеоизображений. Это также применимо к режиму сдвига вверх.
Когда субтитр 7110 перемещения вверх видео, субтитр 7111 перемещения вниз видео или запись 7102 потока не зарегистрирована в STN-таблице, новый PID не указывается посредством модуля 7135 управления воспроизведением, тем самым PG-декодер 4072 поддерживает PID, сохраненный на этой стадии, как есть. В этом случае, второй модуль 4732 кадрирования может предоставлять для PG-плоскости 4704 вертикальное смещение. Это смещение является идентичным смещению, предоставленному посредством модуля 6501 сдвига видео для плоскостей 4701, 4702 первичного видео. Фиг. 72C является принципиальной схемой, показывающей субтитр SB1, отображаемый в режиме без изменения. Фиг. 72D является принципиальной схемой, показывающей субтитр SB3, отображаемый в режиме сдвига вверх, когда субтитр 7110 перемещения вверх видео не зарегистрирован в STN-таблице. Как показано на фиг. 72C, в режиме без изменения субтитр SB1 отображается поверх нижней части области VP1 отображения видеоизображений. Кроме того, черные полосы BT и BB, которые имеют высоту в 131 пиксел, отображаются в частях выше и ниже области VP1 отображения видеоизображений, соответственно. Как показано на фиг. 72D, в режиме сдвига вверх черная полоса BB2, которая имеет высоту в 262 пиксела, отображается в части ниже области VP2 отображения видеоизображений. Если позиция отображения горизонтального субтитра SB1 удерживается в позиции в режиме без изменения, то нижняя часть субтитра SB1 отображается поверх черной полосы BB2. Напротив, когда второй модуль 4732 кадрирования предоставляет для PG-плоскости 4704 вертикальное смещение, как показано на фиг. 72D, в режиме сдвига вверх субтитр SB3 отображается в нижней части области VP2 отображения видеоизображений в позиции, отдельной от черной полосы BB2, аналогично субтитру SB1 в режиме без изменения.
Второй вариант осуществления
BD-ROM-диск согласно варианту осуществления 2 настоящего изобретения также включает в себя пару базового вида и зависимого вида для PG-потока и IG-потока. С другой стороны, устройство воспроизведения согласно варианту осуществления 2 настоящего изобретения содержит режим 2 плоскостей. "Режим 2 плоскостей" является одним из режимов отображения для графической плоскости. Когда суб-TS включает в себя и графический поток для воспроизведения базового вида и зависимого вида, устройство воспроизведения в режиме 2 плоскостей декодирует и поочередно выводит данные графической плоскости для просмотра левым глазом и правым глазом из графических потоков. Трехмерные графические изображения тем самым могут воспроизводиться из графических потоков. Помимо этих аспектов, BD-ROM-диск и устройство воспроизведения согласно варианту осуществления 2 имеют идентичную структуру и работают идентично варианту осуществления 1. Соответственно, ниже приводится описание BD-ROM-диска и устройства воспроизведения согласно варианту осуществления 2 относительно того, что изменено или дополнено по сравнению с вариантом осуществления 1. Подробности относительно частей BD-ROM-диска и устройства воспроизведения, которые являются идентичными частям по варианту осуществления 1, могут быть обнаружены в описании варианта осуществления 1.
<Структура данных суб-TS>
Фиг. 73A является списком элементарных потоков, мультиплексированных в первом суб-TS на BD-ROM-диске 101. Первый суб-TS является мультиплексированными потоковыми данными в формате MPEG-2 TS и включается в файл DEP для L/R-режима. Как показано на фиг. 73A, первый суб-TS включает в себя поток 7311 первичного видео, PG-потоки 7312A и 7312B для просмотра левым глазом, PG-потоки 7313A и 7313B для просмотра правым глазом, IG-поток 7314 для просмотра левым глазом, IG-поток 7315 для просмотра правым глазом и поток 7316 вторичного видео. Когда поток первичного видео 301 в основном TS, показанном на фиг. 3A, представляет вид для просмотра левым глазом трехмерных видеоизображений, поток 7311 первичного видео, который является видеопотоком для просмотра правым глазом, представляет вид для просмотра правым глазом трехмерных видеоизображений. Пары PG-потоков 7312A+7313A и 7312B+7313B для просмотра левым глазом и правым глазом представляют вид для просмотра левым глазом и вид для просмотра правым глазом графических изображений, таких как субтитры, когда эти графические изображения отображаются как трехмерные видеоизображения. Пара IG-потоков 7314 и 7315 для просмотра левым глазом и правым глазом представляет вид для просмотра левым глазом и вид для просмотра правым глазом графических изображений для интерактивного экрана, когда эти графические изображения отображаются как трехмерные видеоизображения. Когда поток 306 вторичного видео в основном TS представляет вид для просмотра левым глазом трехмерных видеоизображений, поток 7316 вторичного видео, который является видеопотоком для просмотра правым глазом, представляет вид для просмотра правым глазом трехмерных видеоизображений.
PID назначаются элементарным потокам 7311-7316, например, следующим образом. PID 0x1012 назначается потоку 7311 первичного видео. Когда до 32 других элементарных потоков могут быть мультиплексированы по типу в одном суб-TS, PG-потокам 7312A и 7312B для просмотра левым глазом назначается любое значение от 0x1220 до 0x123F, а PG-потокам 7313A и 7313B для просмотра правым глазом назначается любое значение от 0x1240 до 0x125F. IG-потоку 7314 для просмотра левым глазом назначается любое значение от 0x1420 до 0x143F, а IG-потоку 7315 для просмотра правым глазом назначается любое значение от 0x1440 до 0x145F. Потоку 7316 вторичного видео назначается любое значение от 0x1B20 до 0x1B3F.
Фиг. 73B является списком элементарных потоков, мультиплексированных во втором суб-TS на BD-ROM-диске 101. Второй суб-TS является мультиплексированными потоковыми данными в формате MPEG-2 TS и включается в файл DEP для режима глубины. Альтернативно, второй суб-TS может быть мультиплексирован в том же файле DEP, что и первый суб-TS. Как показано на фиг. 73B, второй суб-TS включает в себя поток 7321 первичного видео, PG-потоки 7323A и 7323B карт глубины, IG-поток 7324 карт глубины и поток 7326 вторичного видео. Поток 7321 первичного видео является потоком карт глубины и представляет трехмерные видеоизображения в комбинации с потоком 301 первичного видео в основном TS. Когда двумерные видеоизображения, представленные посредством PG-потоков 323A и 323B в основном TS, используются для того, чтобы проецировать трехмерные видеоизображения на виртуальном двумерном экране, PG-потоки 7323A и 7323B карты глубины используются в качестве PG-потоков, представляющих карту глубины для трехмерных видеоизображений. Когда двумерные видеоизображения, представленные посредством IG-потока 304 в основном TS, используются для того, чтобы проецировать трехмерные видеоизображения на виртуальном двумерном экране, IG-поток 7324 карты глубины используется как IG-поток, представляющий карту глубины для трехмерных видеоизображений. Поток 7326 вторичного видео является потоком карт глубины и представляет трехмерные видеоизображения в комбинации с потоком 306 вторичного видео в основном TS.
PID назначаются элементарным потокам 7321-7326, например, следующим образом. PID 0x1013 назначается потоку 7321 первичного видео. Когда до 32 других элементарных потоков могут быть мультиплексированы по типу в одном суб-TS, PG-потокам 7323A и 7323B карт глубины назначается любое значение от 0x1260 до 0x127F. IG-потоку 7324 карты глубины назначается любое значение от 0x1460 до 0x147F. Потоку 7326 вторичного видео назначается любое значение от 0x1B40 до 0x1B5F.
<Структура данных STN-таблицы SS>
Фиг. 74 является принципиальной схемой, показывающей структуру данных STN-таблицы SS 3130 согласно варианту осуществления 2 настоящего изобретения. Как показано на фиг. 74, последовательности 3301, 3302, 3303, ..., информации регистрации потоков в STN-таблице SS 3130 включают в себя последовательность 7413 информации регистрации потоков для PG-потока и последовательность 7414 информации регистрации потоков для IG-потока в дополнение к смещению в ходе отображения всплывающего меню 3311 и последовательности 3312 информации регистрации потоков для видеопотока для воспроизведения зависимого вида, которые показаны на фиг. 33.
Последовательность 7413 информации регистрации потоков для PG-потока включает в себя информацию регистрации потоков, указывающую PG-потоки, которые могут выбираться для воспроизведения из суб-TS. Последовательность 7414 информации регистрации потоков IG-потока включает в себя информацию регистрации потоков, указывающую IG-потоки, которые могут выбираться для воспроизведения из суб-TS. Эти последовательности 7413 и 7414 информации регистрации потоков используются в комбинации с последовательностями информации регистрации потоков, включенными в STN-таблицу соответствующего PI, которые указывают PG-потоки и IG-потоки. При считывании фрагмента информации регистрации потоков из STN-таблицы устройство 102 воспроизведения в режиме трехмерного воспроизведения также автоматически считывает последовательность информации регистрации потоков, расположенную в STN-таблице SS, которая комбинирована с фрагментом информации регистрации потоков. При простом переключении режима двумерного воспроизведения на режим трехмерного воспроизведения устройство 102 воспроизведения тем самым может поддерживать уже распознанные STN и атрибуты потока, такие как язык.
Как дополнительно показано на фиг. 74, последовательность 7413 информации регистрации потоков для PG-потока, в общем, включает в себя множество фрагментов информации 7431 регистрации потоков. Их число является идентичным числу фрагментов информации регистрации потоков в соответствующем PI, который указывает PG-потоки. Последовательность 7414 информации регистрации потоков IG-потока включает в себя один тип фрагментов информации регистрации потоков. Их число является идентичным числу фрагментов информации регистрации потоков в соответствующем PI, который указывает IG-потоки.
Каждый фрагмент информации 7431 регистрации потоков включает в себя STN 7441, стереоскопический флаг (is_SS_PG) 7442, запись 7443 потока для воспроизведения базового вида (stream_entry_for_base_view), запись 7444 потока для воспроизведения зависимого вида (stream_entry_for_dependent_view) и информацию 7445 атрибутов потока. STN 7441 является порядковым номером, назначенным по отдельности фрагментам информации 7431 регистрации потоков, и является идентичным STN, назначенным фрагменту информации регистрации потоков, расположенной в соответствующем PI, с которым комбинируется фрагмент информации 7431 регистрации потоков. Стереоскопический флаг 7442 указывает то, включает или нет BD-ROM-диск 101 в себя оба PG-потока для воспроизведения базового вида и зависимого вида. Если стереоскопический флаг 7442 помечен, суб-TS включает в себя оба PG-потока. Соответственно, устройство воспроизведения считывает все поля в записи 7443 потока для воспроизведения базового вида, записи 7444 потока для воспроизведения зависимого вида и информации 7445 атрибутов потока. Если стереоскопический флаг 7442 снят, устройство воспроизведения игнорирует все эти поля 7443-7445. Как запись 7443 потока для воспроизведения базового вида, так и запись 7444 потока для воспроизведения зависимого вида включают в себя ссылочную информацию 7421 идентификаторов подпутей, ссылочную информацию 7422 файлов потока и PID 7423. Ссылочная информация 7421 идентификаторов подпутей указывает идентификатор подпути для подпути, который указывает пути воспроизведения PG-потоков для воспроизведения базового вида и зависимого вида. Ссылочная информация 7422 файлов потока - это информация, чтобы идентифицировать файл DEP, сохраняющий PG-потоки. PID 7423 - это PID для PG-потоков. Информация 7445 атрибутов потока включает в себя атрибуты для PG-потоков, к примеру, языковой тип.
Следует отметить, что информация 7431 регистрации потоков для PG-потока может сохраняться в STN-таблице вместо STN-таблицы SS. В этом случае, информация 7431 регистрации потоков сохраняется в PG-потоках в основном TS, в частности, в информации атрибутов потока.
<Декодер системных целевых объектов>
Фиг. 75 является функциональной блок-схемой декодера 7525 системных целевых объектов согласно варианту осуществления 2 настоящего изобретения. Как показано на фиг. 75, PG-декодер 7501 поддерживает режим 2 плоскостей, в отличие от PG-декодера, показанного на фиг. 45. В частности, PG-декодер 7501 включает в себя PG-декодер 7511 для воспроизведения базового вида и PG-декодер 7512 для воспроизведения зависимого вида. В дополнение к декодированию PG-потоков 303A и 303B в основном TS, показанном на фиг. 3A, PG-декодер 7511 для воспроизведения базового вида декодирует PG-потоки 7312A и 7312B для просмотра левым глазом в первом суб-TS, показанном на фиг. 73A, в данные плоскости. PG-декодер 7512 для воспроизведения зависимого вида декодирует PG-потоки 7313A и 7313B для просмотра правым глазом в первом суб-TS, показанном на фиг. 73A, и PG-потоки 7323A и 7323B карт глубины во втором суб-TS, показанном на фиг. 73B, в данные плоскости. Декодер вторичного видео и IG-декодер включают в себя аналогичную пару декодеров. Декодер 7525 системных целевых объектов дополнительно включает в себя пару запоминающих устройств 7521 и 7522 PG-плоскости. PG-декодер 7511 для воспроизведения базового вида записывает данные плоскости в запоминающее устройство 7521 левой PG-плоскости, а PG-декодер 7512 для воспроизведения зависимого вида записывает данные плоскости в запоминающее устройство 7522 правой PG-плоскости. Запоминающее устройство IG-плоскости и запоминающее устройство плоскости изображений имеют аналогичные структуры. Декодер 7525 системных целевых объектов дополнительно ассоциирует вывод данных плоскости из запоминающего устройства графической плоскости с режимом 2 плоскостей, режимом 1 плоскости+смещения и режимом 1 плоскости+нулевого смещения. В частности, когда модуль 4235 управления воспроизведением указывает режим 2 плоскостей, декодер 7525 системных целевых объектов поочередно выводит данные плоскости из пары запоминающих устройств 7521 и 7522 PG-плоскости в сумматор 7526 плоскостей.
<Сумматоры плоскостей>
Фиг. 76 является частичной функциональной блок-схемой сумматора 7526 плоскостей в режиме 2 плоскостей. Как показано на фиг. 76, сумматор 6226 плоскостей включает в себя модуль 4710 формирования параллактического видео, переключатель 4720, первый сумматор 4741 и второй сумматор 4742, аналогично сумматору 4226 плоскостей, показанному на фиг. 47. Сумматор 7526 плоскостей дополнительно включает в себя второй модуль 7610 формирования параллактического видео и второй переключатель 7620 в качестве модулей для ввода данных 7604 и 7605 PG-плоскости. Аналогичная структура включается в модули для ввода данных плоскости вторичного видео, данных IG-плоскости и данных плоскости изображений.
Второй модуль 7610 формирования параллактического видео принимает данные 7604 левой PG-плоскости и данные 7605 правой PG-плоскости из декодера 7525 системных целевых объектов. В устройстве 102 воспроизведения в L/R-режиме, данные 7604 левой PG-плоскости представляют PG-плоскость для просмотра левым глазом, а данные 7605 правой PG-плоскости представляют PG-плоскость для просмотра правым глазом. Здесь, второй модуль 7610 формирования параллактического видео передает фрагменты данных 7604 и 7605 плоскости как есть в переключатель 7620. С другой стороны, в устройстве 102 воспроизведения в режиме глубины, данные 7604 левой PG-плоскости представляют PG-плоскость двумерных графических изображений, а данные 7605 правой PG-плоскости представляют карту глубины, соответствующую двумерным графическим изображениям. В этом случае, второй модуль 7610 формирования параллактического видео сначала вычисляет бинокулярный параллакс для каждого элемента в двумерных графических изображениях с использованием карты глубины. Затем, второй модуль 7610 формирования параллактического видео обрабатывает данные 7604 левой PG-плоскости, чтобы сдвигать позицию представления каждого элемента в двумерном графическом изображении в PG-плоскости влево или вправо в соответствии с вычисленным бинокулярным параллаксом. Это формирует пару PG-плоскостей, представляющую вид для просмотра левым глазом и вид для просмотра правым глазом. Кроме того, второй модуль 7610 формирования параллактического видео выводит эту пару PG-плоскостей во второй переключатель 7620.
Второй переключатель 7620 выводит данные 7604 левой PG-плоскости и данные 7605 правой PG-плоскости, которые имеют идентичную PTS, во второй сумматор 4742 в этом порядке. Второй модуль 4732 кадрирования в режиме 2 плоскостей выводит каждые из данных 7604 и 7605 PG-плоскости во второй сумматор 4742 как есть. Второй сумматор 4742 накладывает каждые из данных 7604 и 7605 PG-плоскости на данные плоскости из первого сумматора 4741 и передает результат в третий сумматор 4743. Как результат, PG-плоскость для просмотра левым глазом накладывается на данные 7601 левой видеоплоскости, и PG-плоскость для просмотра правым глазом накладывается на данные 7602 правой видеоплоскости.
Второй модуль 4732 кадрирования в режиме 2 плоскостей, аналогично второму модулю 4732 кадрирования в режиме 1 плоскости+смещения, показанном на фиг. 47, может предоставлять для каждых из данных 7604 и 7605 PG-плоскости горизонтальное смещение посредством использования значения регулирования смещения. Это предоставляет возможность регулирования глубины видеоизображений трехмерной графики в связи с размером экрана дисплейного устройства 103. Альтернативно, второй модуль 4732 кадрирования, аналогично второму модулю 4732 кадрирования в режиме 1 плоскости+смещения, показанном на фиг. 65 и 69, может предоставлять для каждых из данных 7604 и 7605 PG-плоскости вертикальное смещение посредством использования значения сдвига вверх/вниз видео. Когда трехмерное видеоизображение представляется при отображении в формате "почтовый ящик", это дает возможность представления трехмерного графического изображения (например, субтитра) в черной полосе, которая находится выше или ниже трехмерного видеоизображения.
<Использование информации смещения в режиме 2 плоскостей>
Второй модуль 4732 кадрирования в режиме 2 плоскостей может выполнять управление смещением для графической плоскости для просмотра левым глазом или правым глазом посредством использования информации 4704 смещения. Управление смещением предоставляет следующие преимущества.
В L/R-режиме, вместо PG-потока для просмотра левым глазом в первом суб-TS, показанном на фиг. 73A, PG-поток для двумерного изображения в основном TS (в дальнейшем в этом документе, PG-поток для двумерного изображения сокращенно называется "двумерный PG-поток") может использоваться как данные PG-плоскости для просмотра левым глазом. Другими словами, в записи 7443 потока для воспроизведения базового вида показанный на фиг. 74, ссылочная информация 7421 идентификаторов подпутей указывает основной путь, ссылочная информация 7422 файлов потока указывает файл 2D, который сохраняет двумерный PG-поток, а PID 7423 указывает PID двумерного PG-потока. В этом случае, можно уменьшать объем данных трехмерного видеосодержимого, поскольку первый суб-TS не должен включать в себя PG-поток для просмотра левым глазом. С другой стороны, следующие ошибки могут возникать в трехмерном графическом изображении.
Фиг. 77A, 77B и 77C являются принципиальными схемами, показывающими графическое изображение GOB0 для просмотра левым глазом, представленное посредством двумерного PG-потока, и графические изображения GOB1-GOB3 для просмотра правым глазом, представленные посредством PG-потока для просмотра правым глазом. На фиг. 77A, 77B и 77C, сплошная линия на экране SCR указывает графическое изображение GOB0 для просмотра левым глазом, а пунктирная линия указывает графические изображения GOB1-GOB3 для просмотра правым глазом. По мере того, как расстояния A1, A2 и A3 между графическими изображениями, показанными на фиг. 77A, 77B и 77C, изменяются с небольших на большие в этом порядке (A1<A2<A3), разность в глубине между трехмерным графическим изображением и экраном SCR изменяется, соответственно. Таким образом, когда пара трехмерных графических изображений отображается, как показано на фиг. 77A-77C, в этом порядке, трехмерное графическое изображение, как кажется, выпрыгивает из экрана SCR к зрителю. Когда графическое изображение GOB0 для просмотра левым глазом представляет субтитр, изображение GOB0 также используется в качестве двумерного изображения, тем самым позиция отображения является постоянной через фиг. 77A, 77B и 77C. С другой стороны, позиции отображения графических изображений GOB1-GOB3 для просмотра правым глазом перемещаются влево в порядке фиг. 77A, 77B и 77C. Соответственно, центральные позиции C1, C2 и C3 между графическими изображениями перемещаются влево в порядке фиг. 77A, 77B и 77C. Другими словами, трехмерное графическое изображение субтитра, как кажется, перемещается влево. Такое перемещение субтитра может вызывать чувство некомфортности у зрителей.
Второй модуль 4732 кадрирования в режиме 2 плоскостей не допускает горизонтального перемещения трехмерного графического изображения посредством использования управления смещением согласно информации смещения следующим образом. Фиг. 77D, 77E и 77F являются принципиальными схемами, показывающими управление смещением, выполняемое для графического изображения для просмотра левым глазом, показанного на фиг. 77A, 77B и 77C. На фиг. 77D, 77E и 77F, сплошная линия на экране SCR указывает графические изображения GOB4-GOB6 для просмотра левым глазом после управления смещением, тонкая пунктирная линия указывает графическое изображение GOB0 для просмотра левым глазом перед управлением смещением, а толстая пунктирная линия указывает графические изображения GOB1-GOB3 для просмотра правым глазом. Второй модуль 4732 кадрирования предоставляет для PG-плоскости для просмотра левым глазом смещения OFS1, OFS2 и OFS3, указываемые посредством стрелок на фиг. 77D, 77E и 77F в этом порядке. При этом условии, графические изображения GOB4-GOB6 для просмотра левым глазом после управления смещением перемещаются вправо по сравнению с графическим изображением GOB0 для просмотра левым глазом перед управлением смещением. Как результат, поскольку центральная позиция CO между графическими изображениями сохраняется постоянной через фиг. 77D-77F, трехмерное графическое изображение, появляется, не перемещается горизонтально. Таким образом, посредством использования двумерного PG-потока в качестве PG-потока для просмотра левым глазом можно не допускать возникновения чувства некомфортности у зрителей.
Третий вариант осуществления
Далее описывается, в качестве варианта осуществления 3 настоящего изобретения, устройство и способ для записи данных на носители записи вариантов осуществления 1 и 2 настоящего изобретения. Записывающее устройство, описанное здесь, называется устройством авторинга. Устройство авторинга, в общем, находится в творческой студии и используется пользователями, занимающимися авторингом, чтобы создавать киносодержимое, которое должно распространяться. Во-первых, в ответ на операции пользователями, занимающимися авторингом, устройство записи преобразует киносодержимое в файлы AV-потока с использованием предварительно определенного способа кодирования со сжатием. Затем, устройство записи формирует сценарий. "Сценарий" - это информация, задающая то, как каждый тайтл, включенный в киносодержимое, должен воспроизводиться. В частности, сценарий включает в себя информацию динамического сценария и информацию статического сценария. Затем, устройство записи формирует образ тома для BD-ROM-диска из файлов AV-потока и сценария. В завершение, устройство записи записывает образ тома на носителе записи.
Фиг. 78 является функциональной блок-схемой устройства 7800 записи. Как показано на фиг. 78, устройство 7800 записи включает в себя модуль 7801 хранения баз данных, видеокодер 7802, модуль 7803 создания материала, модуль 7804 формирования сценариев, модуль 7805 создания BD-программ, процессор 7806 мультиплексирования и процессор 7807 форматов.
Модуль 7801 хранения баз данных является энергонезависимым устройством хранения данных, встроенным в записывающее устройство, и является, в частности, жестким диском (HDD). Альтернативно, модуль 7801 хранения баз данных может быть внешним HDD, подключенным к устройству записи, или энергонезависимым полупроводниковым запоминающим устройством, внутренним или внешним для устройства записи.
Видеокодер 7802 принимает видеоданные, такие как несжатые данные битовой карты, от пользователей, занимающихся авторингом, и сжимает принимаемые видеоданные в соответствии со способом кодирования со сжатием, таким как MPEG-4 AVC или MPEG-2. Этот процесс преобразует данные первичного видео в поток первичного видео и данные вторичного видео в поток вторичного видео. В частности, данные трехмерного видеоизображения преобразуются в пару из видеопотока для воспроизведения базового вида и видеопотока для воспроизведения зависимого вида, как показано на фиг. 7, с использованием способа многовидового кодирования, такого как MVC. Другими словами, последовательность видеокадров, представляющая вид для просмотра левым глазом, преобразуется в видеопоток для воспроизведения базового вида через межкадровое прогнозирующее кодирование для изображений в этих видеокадрах. С другой стороны, последовательность видеокадров, представляющая вид для просмотра правым глазом, преобразуется в видеопоток для воспроизведения зависимого вида через прогнозирующее кодирование не только для изображений в этих видеокадрах, но также и изображений для воспроизведения базового вида. Следует отметить, что видеокадры, представляющие вид для просмотра правым глазом, могут быть преобразованы в видеопоток для воспроизведения базового вида, и видеокадры, представляющие вид для просмотра левым глазом, могут быть преобразованы в видеопоток для воспроизведения зависимого вида. Преобразованные видеопотоки 7812 сохраняются в модуле 7801 хранения баз данных.
Во время процесса межкадрового прогнозирующего кодирования, видеокодер 7802 обнаруживает векторы движения между отдельными изображениями в виде для просмотра левым глазом и виде для просмотра правым глазом и вычисляет информацию глубины каждого трехмерного видеоизображения на основе обнаруженных векторов движения. Фиг. 79A и 79B являются принципиальными схемами, соответственно, показывающими изображение в виде для просмотра левым глазом и виде для просмотра правым глазом, используемых для того, чтобы отображать одну сцену трехмерных видеоизображений, а фиг. 79C является принципиальной схемой, показывающей информацию глубины, вычисляемую из этих изображений посредством видеокодера 7802.
Видеокодер 7802 сжимает изображения для просмотра левым глазом и правым глазом с использованием избыточности между изображениями. Другими словами, видеокодер 7802 сравнивает оба несжатых изображения на основе макроблока, т.е. в расчете на матрицы 8x8 или 16x16 пикселов, чтобы обнаруживать вектор движения для каждого изображения в двух изображениях. В частности, как показано на фиг. 79A и 79B, изображение 7901 для просмотра левым глазом и изображение 7902 для просмотра правым глазом сначала разделяются на макроблоки 7903. Затем, области, занимаемые посредством данных изображений в изображении 7901 и изображении 7902, сравниваются для каждого макроблока 7903, и вектор движения для каждого изображения обнаруживается на основе результата сравнения. Например, область, занимаемая посредством изображения 7904, показывающим "дом" в изображении 7901, является практически идентичной области в изображении 7902. Соответственно, вектор движения не обнаруживается из таких областей. С другой стороны, область, занимаемая посредством изображения 7905, показывающего "круг" в изображении 7901, существенно отличается от области в изображении 7902. Соответственно, вектор движения изображения 7905 обнаруживается из этих областей.
Видеокодер 7802 использует обнаруженный вектор движения, чтобы сжимать изображения 7901 и 7902. С другой стороны, модуль 7905 формирования информации глубины кадра использует вектор VCT движения, чтобы вычислять бинокулярный параллакс каждого изображения, такого как изображение 7904 "дома" и изображение 7905 "круга". Видеокодер 7802 дополнительно вычисляет глубину каждого изображения из бинокулярного параллакса изображения. Информация, указывающая глубину каждого изображения, может быть организована в матрицу 7906 размера, идентичного размеру матрицы макроблоков в изображениях 7901 и 7902, как показано на фиг. 79C. В этой матрице 7906, блоки 7907 находятся в соответствии "один-к-одному" с макроблоками 7903 в изображениях 7901 и 7902. Каждый блок 7907 указывает глубину изображения, показанного посредством соответствующих макроблоков 7903, с использованием, например, глубины в 8 битов. В примере, показанном на фиг. 79, глубина изображения 7905 "круга" сохраняется в каждом из блоков в области 7908 в матрице 7906. Эта область 7908 соответствует всем областям в изображениях 7901 и 7902, которые представляют изображение 7905.
Видеокодер 7802 может использовать информацию глубины, чтобы формировать карту глубины для просмотра левым глазом или для просмотра правым глазом. В этом случае, видеокодер 7802, соответственно, кодирует потоковые данные для просмотра левым глазом или правым глазом и соответствующий поток карт глубины как видеопоток для воспроизведения базового вида и поток карт глубины посредством использования прогнозирующего кодирования между изображениями, включенными сам в видеокодер 7802. Каждый видеопоток 7812 после преобразования сохраняется в модуле 7801 хранения баз данных.
Видеокодер 7802 дополнительно может использовать информацию глубины, чтобы вычислять ширину WDH полосы AL или AR в вертикальном направлении, которая включена в любой из вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, показанного на фиг. 60B и 60C, и высоту HGT полосы AT или AB в горизонтальном направлении, которая включена в любой из вида LV для просмотра левым глазом и вида RV для просмотра правым глазом, показанного на фиг. 61B и 61C. Фактически, когда изображение объекта включается в вертикальную или горизонтальную полосу, вектор движения этого изображения обнаруживается как указывающий "выпадение кадров" из вида для просмотра левым глазом к виду для просмотра правым глазом или наоборот. Соответственно, видеокодер 7802 может вычислять ширину или высоту каждой полосы из этого вектора движения. Информация 7811, указывающая вычисленную ширину и высоту (в дальнейшем упоминаемая как "информация маскирующей области"), хранится в модуле 7801 хранения баз данных.
При кодировании потока вторичного видео из данных двумерного видеоизображения видеокодер 7802 также может создавать информацию 7810 смещения для плоскости вторичного видео в соответствии с операциями пользователей, занимающихся авторингом. Сформированная информация 7810 смещения сохраняется в модуле 7801 хранения баз данных.
Модуль 7803 создания материала создает элементарные потоки, отличные от видеопотоков, такие как аудиопоток 7813, PG-поток 7814 и IG-поток 7815, и сохраняет созданные потоки в модуль 7801 хранения баз данных. Например, модуль 7803 создания материала принимает несжатые LPCM-аудиоданные от пользователей, занимающихся авторингом, кодирует несжатые LPCM-аудиоданные в соответствии со способом кодирования со сжатием, таким как AC-3, и преобразует кодированные LPCM-аудиоданные в аудиопоток 7813. Модуль 7803 создания материала также принимает файл информации о субтитрах от пользователей, занимающихся авторингом, и создает PG-поток 7814 в соответствии с файлом информации о субтитрах. Файл информации о субтитрах задает данные изображений или текстовые данные для показа субтитров, распределения времени отображения субтитров и визуальных эффектов, которые должны добавляться к субтитрам, таких как выход из затемнения и затемнение. Кроме того, модуль 7803 создания материала принимает данные битовой карты и файл меню от пользователей, занимающихся авторингом, и создает IG-поток 7815 в соответствии с данными битовой карты и файлом меню. Данные битовой карты показывают изображения, которые должны отображаться на меню. Файл меню задает то, как каждая кнопка в меню должна переводиться из одного состояния в другое, и задает визуальные эффекты, которые должны добавляться к каждой кнопке.
В ответ на операции пользователями, занимающимися авторингом, модуль 7803 создания материала дополнительно создает информацию 7810 смещения согласно PG-потоку 7814 и IG-потоку 7815. В этом случае, модуль 7803 создания материала может использовать информацию DPI глубины, сформированную посредством видеокодера 7802, чтобы регулировать глубину трехмерных графических видеоизображений с помощью глубины трехмерных видеоизображений. В этом случае, когда глубина трехмерных видеоизображений значительно изменяется в расчете на каждый кадр, модуль 7803 создания материала дополнительно может обрабатывать последовательность значений смещения, созданных с использованием информации DPI глубины, в фильтре низких частот, чтобы сокращать изменение в расчете на каждый кадр. Информация 7810 смещения, созданная таким образом, сохраняется в модуле 7801 хранения баз данных.
Модуль 7804 формирования сценариев создает данные 7817 BD-ROM-сценариев в ответ на инструкцию, принимаемую от пользователей, занимающихся авторингом, через GUI, а затем сохраняет созданные данные 7817 BD-ROM-сценариев в модуле 7801 хранения баз данных. Данные 7817 BD-ROM-сценариев задают способы воспроизведения элементарных потоков 7812-7816, сохраненных в модуле 7801 хранения баз данных. Из группы файлов, показанной на фиг. 2, данные 7817 BD-ROM-сценариев включают в себя индексный файл 211, файл 212 кинообъектов и файлы 221-223 списков воспроизведения. Модуль 7804 формирования сценариев дополнительно создает файл PRF параметров и передает созданный файл PRF параметров в процессор 7806 мультиплексирования. Файл PRF параметров задает, из элементарных потоков 7812-7816, сохраненных в модуле 7801 хранения баз данных, потоковые данные, которые должны быть мультиплексированы в основной TS и суб-TS.
Модуль 7805 создания BD-программ предоставляет пользователям, занимающимся авторингом, среду программирования для программирования BD-J-объектов и Java-приложений. Модуль 7805 создания BD-программ принимает запрос от пользователя через GUI и создает исходный код каждой программы согласно запросу. Модуль 7805 создания BD-программ дополнительно создает файл 251 BD-J-объектов из BD-J-объектов и сжимает Java-приложения в JAR-файл 261 JAR. Программные файлы BDP передаются в процессор 7807 форматов.
Здесь, допускается, что BD-J-объект программируется следующим образом: BD-J-объект инструктирует модулю 4234 выполнения программ, показанному на фиг. 42, передавать графические данные для GUI в декодер 4225 системных целевых объектов. Кроме того, BD-J-объект инструктирует декодеру 4225 системных целевых объектов обрабатывать графические данные как данные плоскости изображений и выводить данные плоскости изображений в сумматор 4226 плоскостей в режиме 1 плоскости+смещения. В этом случае, модуль 7805 создания BD-программ может создавать информацию 7810 смещения, соответствующую плоскости изображений, и сохранять информацию 7810 смещения в модуле 7801 хранения баз данных. Здесь, модуль 7805 создания BD-программ может использовать информацию DPI глубины, сформированную посредством видеокодера 7802, при создании информации 7810 смещения.
В соответствии с файлом PRF параметров, процессор 7806 мультиплексирования мультиплексирует каждый из элементарных потоков 7812-7816, сохраненных в модуле 78014 хранения баз данных, чтобы формировать файл потока в формате MPEG-2 TS. Более конкретно, как показано на фиг. 4, сначала каждый из элементарных потоков 7812-7815 преобразуется в последовательность исходных пакетов, и исходные пакеты, включенные в каждую последовательность, ассемблируются, чтобы составлять один фрагмент мультиплексированных потоковых данных. Таким образом, основной TS и суб-TS создаются. Эти фрагменты мультиплексированных потоковых данных MSD выводятся в процессор 7807 форматов.
Кроме того, процессор 7806 мультиплексирования создает метаданные смещения на основе информации 7810 смещения, сохраненной в модуле 7801 хранения баз данных. Как показано на фиг. 11, созданные метаданные 1110 смещения сохраняются в видеопотоке для воспроизведения зависимого вида. Здесь, информация 7811 маскирующей области, сохраненная в модуле 7801 хранения баз данных, сохраняется в видеопотоке для воспроизведения зависимого вида вместе с метаданными смещения. Следует отметить, что процессор 7806 мультиплексирования может обрабатывать каждый фрагмент графических данных, чтобы регулировать компоновку графических элементов в кадрах левого и правого видеоизображений так, что трехмерные графические изображения, представленные посредством каждой графической плоскости, не отображаются как перекрывающиеся в визуальном направлении, совпадающем с визуальным направлением трехмерных графических изображений, представленных посредством других графических плоскостей. Альтернативно, процессор 7806 мультиплексирования может регулировать значение смещения для каждой графической плоскости так, что глубины трехмерных графических изображений не перекрываются.
Дополнительно, процессор 7806 мультиплексирования создает файл информации о двумерных клипах и файл информации о клипах для воспроизведения зависимого вида через следующие четыре этапа. (I) Создание карты 2230 вхождений, показанной на фиг. 23, для файла 2D и файла DEP. (II) Создание начальных точек 2242 и 2420 экстентов, показанных на фиг. 24A и 24B, с помощью карты вхождений каждого файла. Здесь, он совмещает ATC-времена экстента между последовательными блоками данных (см. ниже). Кроме того, он создает компоновку экстентов так, что размеры двумерных экстентов, экстентов для воспроизведения базового вида, экстентов для воспроизведения зависимого вида и экстентов SS удовлетворяют предварительно определенным условиям (касательно этих условий см. в разделе <<Дополнительное пояснение>>). (III) Извлечение информации 2220 атрибутов потока, показанной на фиг. 22, из каждого элементарного потока, который должен быть мультиплексирован в основной TS и суб-TS. (IV) Ассоциирование, как показано на фиг. 22, комбинации карты 2230 вхождений, трехмерных метаданных 2240 и информации 2220 атрибутов потока с фрагментом информации 2210 о клипах. Каждый файл CLI информации о клипах тем самым создается и передается в процессор 7307 форматов.
Процессор 7807 форматов создает образ 7820 BD-ROM-диска со структурой каталогов, показанной на фиг. 2, из (i) данных 7817 BD-ROM-сценариев, сохраненных в модуле 7801 хранения баз данных, (ii) группы программных файлов BDP, таких как файлы BD-J-объектов, созданные посредством модуля 7805 создания BD-программ, и (iii) мультиплексированных потоковых данных MSD и файлов CLI информации о клипах, сформированных посредством процессора 7806 мультиплексирования. В этой структуре каталогов UDF используется в качестве файловой системы.
При создании записей файлов для каждого из файлов 2D, файлов DEP и файлов SS процессор 7807 форматов обращается к картам вхождений и трехмерным метаданным, включенным в файлы информации о двумерных клипах и файлы информации о клипах для воспроизведения зависимого вида. SPN для каждой точки входа и начальной точки экстента тем самым используется при создании каждого дескриптора выделения. В частности, значение LBN и размера экстента, которое должно представляться посредством каждого дескриптора выделения, определяется, чтобы выражать перемеженную компоновку, аналогично компоновке, показанной на фиг. 19. Как результат, каждый блок данных для воспроизведения базового вида совместно используется посредством файла SS и файла 2D, и каждый блок данных для воспроизведения зависимого вида совместно используется посредством файла SS и файла DEP.
<Способ записи образа BD-ROM-диска>
Фиг. 80 является блок-схемой последовательности операций способа для записи киносодержимого на BD-ROM-диске с использованием устройства 7800 записи, показанного на фиг. 78. Этот способ начинается, например, когда питание в устройстве 7800 записи включается.
На этапе S8001, элементарные потоки, программы и данные сценариев, которые должны быть записаны на BD-ROM-диске, создаются. Другими словами, видеокодер 7802 создает видеопоток 7812. Модуль 7803 создания материала создает аудиопоток 7813, PG-поток 7814 и IG-поток 7815. Модуль 7804 формирования сценариев создает данные 7817 BD-ROM-сценариев. Эти созданные фрагменты данных 7812-7817 сохраняются в модуле 7801 хранения баз данных. С другой стороны, видеокодер 7802 создает информацию 7810 смещения и информацию 7811 маскирующей области и сохраняет эти фрагменты информации в модуле 7801 хранения баз данных. Модуль 7803 создания материала создает информацию 7810 смещения и сохраняет эту информацию в модуле 7801 хранения баз данных. Модуль 7804 формирования сценариев создает файл PRF параметров и передает этот файл в процессор 7806 мультиплексирования. Модуль 7805 создания BD-программ создает группу программных файлов BDP, которые включают в себя файл BD-J-объектов и файл JAR, и передает эту группу BDP в процессор 7807 форматов. Модуль 7805 создания BD-программ также создает информацию 7810 смещения и сохраняет эту информацию в модуле 7801 хранения баз данных. После этого, обработка переходит к этапу S8002.
На этапе S8002, процессор 7806 мультиплексирования создает метаданные смещения на основе информации 7810 смещения, сохраненной в модуле 7801 хранения баз данных. Созданные метаданные смещения сохраняются в видеопотоке для воспроизведения зависимого вида наряду с информацией 7811 маскирующей области. После этого, обработка переходит к этапу S8003.
На этапе S8003, процессор 7806 мультиплексирования считывает элементарные потоки 7812-7816 из модуля 7801 хранения баз данных в соответствии с файлом PRF параметров и мультиплексирует эти потоки в файл потока в формате MPEG2-TS. После этого, обработка переходит к этапу S8004.
На этапе S8004, процессор 7806 мультиплексирования создает файл информации о двумерных клипах и файл информации о клипах для воспроизведения зависимого вида. В частности, во время создания карты вхождений и начальных точек экстентов, ATC-время экстента совмещается между смежными блоками данных. Кроме того, размеры двумерных экстентов, экстентов для воспроизведения базового вида, экстентов для воспроизведения зависимого вида и экстентов SS задаются так, чтобы удовлетворять предварительно определенным условиям. После этого, обработка переходит к этапу S8005.
На этапе S8005, процессор 7807 форматов создает образ 7820 BD-ROM-диска из данных 7817 BD-ROM-сценариев, группы программных файлов BDP, мультиплексированных потоковых данных MDS и файла CLI информации о клипах. После этого, обработка переходит к этапу S8006.
На этапе S8006, образ 7820 BD-ROM-диска преобразуется в данные для тиражирования BD-ROM. Кроме того, эти данные записываются на мастер-BD-ROM-диске. После этого, обработка переходит к этапу S8007.
На этапе S8007, BD-ROM-диски 101 серийно производятся посредством тиражирования мастер-диска, полученного на этапе S8006. Обработка тем самым заканчивается.
<Способ для того, чтобы совмещать ATC-времена экстента>
Фиг. 81 является схематичным представлением, показывающим способ, чтобы совмещать ATC-времена экстента между последовательными блоками данных. Во-первых, ATS вдоль одной временной оси ATC назначаются исходным пакетам, сохраненным в блоке данных для воспроизведения базового вида (в дальнейшем в этом документе, SP1), и исходным пакетам, сохраненным в блоке данных для воспроизведения зависимого вида (в дальнейшем в этом документе, SP2). Как показано на фиг. 81, прямоугольники 8110 и 8120, соответственно, представляют SP1 #p (p=0, 1, 2, 3, ..., k, k+1, ..., i, i+1) и SP2 #q (q=0, 1, 2, 3, ..., m, m+1, ..., j). Эти прямоугольники 8110 и 8120 размещаются по порядку вдоль временной оси ATS каждого исходного пакета. Позиция начала каждого прямоугольника 8110 и 8120 представляет значение ATS исходного пакета. Длина AT1 каждого прямоугольника 8110 и 8120 представляет количество времени, необходимое для устройства трехмерного воспроизведения, чтобы передавать один исходный пакет из буфера считывания в декодер системных целевых объектов.
От ATS A1 SP1 #0 до тех пор, пока ATC-время TEXT экстента не прошло, SP1, т.е. SP1 #0, 1, 2, ..., k, передается из буфера считывания в декодер системных целевых объектов и сохраняется как (n+1)-й экстент EXT1[n] для воспроизведения базового вида в одном блоке данных для воспроизведения базового вида. Аналогично, от ATS A3 SP1 #(k+1) до тех пор, пока ATC-время TEXT экстента не прошло, SP1, т.е. SP1 #(k+1), ..., i, передается из буфера считывания в декодер системных целевых объектов и сохраняется как (n+2)-й экстент EXT1[n+1] для воспроизведения базового вида в следующем блоке данных для воспроизведения базового вида.
С другой стороны, SP2, которая должна сохраняться в как (n+1)-й экстент EXT2[n] для воспроизведения зависимого вида в одном блоке данных для воспроизведения зависимого вида, выбирается следующим образом. Во-первых, сумма ATS A1 SP1 #0 и ATC-времени TEXT экстента, A1+TEXT, находится как ATS A3 SP1 #(k+1), расположенной в начале (n+2)-го экстента EXT1[n+1] для воспроизведения базового вида. Затем, SP2, т.е. SP2 #0, 1, 2, ..., m, выбирается. Передача SP2 из буфера считывания в декодер системных целевых объектов начинается в течение периода с ATS A1 SP1 #0 до ATS A3 SP1 #(k+1). Соответственно, первая SP2, т.е. ATS A2 SP2 #0, всегда равна или превышает первую SP1, т.е. ATS A1 SP1 #0: A2≥A1. Кроме того, вся ATS SP2 #0-m меньше ATS A3 SP1 #(k+1). В этом контексте, завершение передачи последней SP2, т.е. SP #m, может быть при или после ATS A3 SP1 #(k+1).
Аналогично, SP2, которая должна сохраняться как (n+2)-й экстент EXT2[n+1] для воспроизведения зависимого вида в одном блоке данных для воспроизведения зависимого вида, выбирается следующим образом. Во-первых, ATS A5 SP1 #(i+1), расположенная в начале (n+3)-его экстента для воспроизведения базового вида, находится как ATS A5=A3+TEXT. Затем, SP2, т.е. SP2 #(m+1)-j, выбирается. Передача SP2 из буфера считывания в декодер системных целевых объектов начинается в течение периода с ATS A3 SP1 #(k+1) до ATS A5 SP1 #(i+1). Соответственно, первая SP2, т.е. ATS A4 SP2 #(m+1), всегда равна или превышает первую SP1, т.е. ATS A3 SP1 #(k+1): A4≥A3. Кроме того, вся ATS SP2 #(m+1)-j меньше ATS A5 SP1 #(k+1).
Четвертый вариант осуществления
Фиг. 110 является функциональной блок-схемой устройства воспроизведения, реализованного посредством использования интегральной схемы 3 согласно варианту осуществления 4 настоящего изобретения. Это устройство воспроизведения воспроизводит данные, имеющие структуру, описанную в предыдущих вариантах осуществления.
IF-модуль 1 носителя принимает или считывает данные с носителя и передает данные в интегральную схему 3. Следует отметить, что данные включают в себя данные со структурой, описанной в предыдущих вариантах осуществления. IF-модулем 1 носителя является, например, накопитель на дисках, если носителем является оптический диск или жесткий диск; IF платы, если носителем является полупроводниковое запоминающее устройство, такое как карта памяти в формате SD, запоминающее устройство USB и т.д.; CAN-тюнер или Si-тюнер, если носителем является широковещательная волна, к примеру, CATV и т.п.; и сетевой интерфейс, если носителем является сеть, такая как Ethernet™, беспроводная LAN, линия беспроводной связи общего пользования и т.д.
Запоминающее устройство 2 временно сохраняет как данные, принимаемые или считываемые с носителя, так и данные, обрабатываемые посредством интегральной схемы 3. Синхронное динамическое оперативное запоминающее устройство (SDRAM), синхронное динамическое оперативное запоминающее устройство с удвоенной скоростью передачи данных x (DDRx SDRAM; x=1, 2, 3, ...) и т.д. используются в качестве запоминающего устройства 2. Любое число запоминающих устройств 2 может предоставляться; в зависимости от необходимости, запоминающее устройство 2 может быть одним элементом или множеством элементов.
Интегральная схема 3 является системной LSI, которая обрабатывает данные, передаваемые из IF-модуля 1 носителя, с помощью видео- и аудиообработки. Интегральная схема 3 включает в себя главный модуль 6 управления, процессор 5 потоков, процессор 7 сигналов, модуль 9 управления запоминающим устройством и модуль 8 AV-вывода.
Главный модуль 6 управления включает в себя запоминающее устройство программ и ядро процессора. Запоминающее устройство программ предварительно сохраняет основное программное обеспечение, такое как ОС. Ядро процессора имеет таймерную функцию и функцию обработки прерываний и управляет всей интегральной схемой 3 в соответствии с сохраненными программами, например, в запоминающем устройстве программ.
Под управлением главного модуля 6 управления, процессор 5 потоков принимает данные, передаваемые с носителя, через IF-модуль 1 носителя и затем сохраняет данные в запоминающее устройство 2 через шину данных в интегральной схеме 3 или разделяет данные на видеоданные и аудиоданные. Как описано выше, файл двумерного/для просмотра левым глазом AV-потока включает в себя видеопоток для просмотра левым глазом, а файл AV-потока для просмотра правым глазом включает в себя видеопоток для просмотра правым глазом. Кроме того, данные на носителе состоят из файла двумерного/для просмотра левым глазом AV-потока и файла AV-потока для просмотра правым глазом, разделенных на множество экстентов и поочередно размещаемых экстент за экстентом. Следует отметить, что из данных на носителе части, включающие в себя видеопоток для просмотра левым глазом, являются данными для просмотра левым глазом, а части, включающие в себя видеопоток для просмотра правым глазом, являются данными для просмотра правым глазом. Когда интегральная схема 3 принимает данные для просмотра левым глазом и правым глазом, соответственно, главный модуль 6 управления управляет процессором 5 потоков, чтобы сохранять данные в первую область и вторую область в запоминающем устройстве 2. Следует отметить, что первая и вторая области в запоминающем устройстве 2 могут быть логически разделенными областями в одном запоминающем элементе или физически различных запоминающих элементах. Следующее пояснение варианта осуществления 4 допускает то, что данные для просмотра левым глазом и данные для просмотра правым глазом являются данными для воспроизведения основного вида и данными для воспроизведения подвида, соответственно. Аналогичное пояснение может быть применимо, если данные для просмотра правым глазом и данные для просмотра левым глазом являются данными для воспроизведения основного вида и данными для воспроизведения подвида, соответственно.
Под управлением главного модуля 6 управления, процессор 7 сигналов использует соответствующий способ, чтобы декодировать видеоданные и аудиоданные, разделенные посредством процессора 5 потоков. Видеоданные сжимаются с помощью такого способа кодирования, как MPEG-2, MPEG-4 AVC, MPEG-4 MVC, SMPTE VC-1 и т.д. Аудиоданные сжимаются с помощью такого способа кодирования, как Dolby AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD, линейная PCM и т.д. Процессор 7 сигналов декодирует данные с помощью соответствующего способа. Следует отметить, что модель процессора 7 сигналов может быть эквивалентной либо комбинации фильтра TS-приоритетов и различных декодеров, показанных на фиг. 45, либо различным декодерам, показанным на фиг. 46. Кроме того, процессор 7 сигналов извлекает метаданные из видеопотока для просмотра правым глазом и затем сообщает метаданные в модуль 8 AV-вывода. Следует отметить, что, как описано выше, метаданные находятся в каждой из GOP, составляющих видеопоток для просмотра правым глазом, и включают в себя комбинации информации смещения и идентификаторов смещения.
Когда модель процессора 7 сигналов является эквивалентной комбинации фильтра TS-приоритетов и различных декодеров, показанных на фиг. 45, процессор 7 сигналов сначала отслеживает флаги TS-приоритета TS-пакетов, включенных в данные для просмотра правым глазом, и затем использует значения флагов TS-приоритета, чтобы выбирать TS-пакеты, содержащие метаданные. Процессор 7 сигналов следующий выполняет следующие два процесса параллельно посредством использования отдельных модулей: процесс декодирования TS-пакетов, содержащих данные изображений, в данные несжатых изображений и процесс извлечения метаданных из TS-пакетов, содержащих метаданные. Когда модель процессора 7 сигналов является эквивалентной различным декодерам, показанным на фиг. 46, процессор 7 сигналов дает возможность отправки TS-пакетов, содержащих данные для просмотра правым глазом, в один декодер независимо от значений флагов TS-приоритета. Декодер выполняет два процесса декодирования TS-пакетов в данные несжатых изображений и извлечения метаданных из TS-пакетов. Таким образом, когда данные имеют структуру, описанную в предыдущих вариантах осуществления, процессор 7 сигналов любой модели может успешно выполнять процессы как декодирования данных в данные несжатых изображений, так и извлечения метаданных из данных.
Модуль 9 управления запоминающим устройством осуществляет регулирование доступа в запоминающее устройство 2 посредством функциональных блоков в интегральной схеме 3.
Под управлением главного модуля 6 управления, модуль 8 AV-вывода накладывает фрагменты видеоданных, декодированных посредством процессора 7 сигналов, обрабатывает фрагменты видеоданных с помощью преобразования формата и т.п. и затем выводит их в интегральную схему 3.
Фиг. 111 является функциональной блок-схемой, показывающей характерную структуру процессора 5 потоков. Процессор 5 поток содержит IF-модуль 51 потоков в устройстве, демультиплексор 52 и модуль 53 переключения.
IF-модуль 51 потоков в устройстве является интерфейсом для передачи данных между IF-модулем 1 носителя и интегральной схемой 3. Например, IF-модуль 51 потоков в устройстве соответствует последовательному интерфейсу ATA (SATA), пакетному интерфейсу ATA (ATAPI) или параллельному интерфейсу ATA (PATA), если носителем является оптический диск или жесткий диск; IF платы, если носителем является полупроводниковое запоминающее устройство, такое как карта памяти в формате SD, запоминающее устройство USB и т.д.; IF тюнера, если носителем является широковещательная волна, к примеру, CATV и т.п.; и сетевому интерфейсу, если носителем является сеть, к примеру, Ethernet™, беспроводная LAN или линия беспроводной связи общего пользования. Следует отметить, что, в зависимости от типа носителя, IF-модуль 51 потоков в устройстве может осуществлять часть функций IF-модуля 1 носителя, или IF-модуль 1 носителя может встраиваться в интегральную схему 3 и использоваться как IF-модуль 51 потоков в устройстве.
Демультиплексор 52 отделяет видеоданные и аудиоданные из данных для воспроизведения, включающих в себя видеоизображения и звуки, причем данные для воспроизведения включаются в данные, передаваемые с носителя. Каждый из вышеописанных экстентов состоит из исходных пакетов, содержащих различные данные, такие как видеоизображения, звуки, PG (субтитры) и IG (меню). В некоторых случаях, тем не менее, данные для воспроизведения подвида могут не включать в себя аудиопоток. Каждый экстент разделяется на видео- и аудио-TS-пакеты в зависимости от PID (идентификаторов), включенных в исходные пакеты, и затем передается в процессор 7 сигналов. Обработанные данные передаются в процессор 7 сигналов непосредственно или после временного сохранения в запоминающем устройстве 2. Следует отметить, что модель демультиплексора 52 соответствует, например, модулям депакетирования источников и PID-фильтрам, показанным на фиг. 45.
Модуль 53 переключения изменяет назначения для вывода или хранения данных, которые принимает IF-модуль 51 потоков в устройстве. В частности, когда IF-модуль 51 потоков в устройстве принимает данные для просмотра левым глазом, модуль 53 переключения переключает назначение данных на первую область запоминающего устройства 2, тогда как когда IF-модуль 51 потоков в устройстве принимает данные для просмотра правым глазом, модуль 53 переключения переключает назначение данных на вторую область запоминающего устройства 2. Модулем 53 переключения является, например, контроллер прямого доступа к памяти (DMAC). Фиг. 112 является функциональной блок-схемой модуля 53 переключения и окружающих модулей, когда модулем 53 переключения является DMAC. Под управлением главного модуля 6 управления, DMAC 53 передает принимаемые данные и адрес получателя в модуль 9 управления запоминающим устройством; причем принимаемые данные являются данными, которые принимает IF-модуль 51 потоков в устройстве, а адрес получателя является адресом, по которому принимаемые данные должны сохраняться. В частности, допустим, что адреса 1 и 2 являются адресами первой области и второй области в запоминающем устройстве 2, соответственно. Когда принимаемые данные являются данными для просмотра левым глазом, DMAC 53 передает адрес 1 в модуль 9 управления запоминающим устройством, тогда как когда принимаемые данные являются данными для просмотра правым глазом, DMAC 53 передает адрес 2. Модуль 9 управления запоминающим устройством сохраняет принимаемые данные в запоминающее устройство 2 в соответствии с адресами получателя, передаваемыми из модуля 53 переключения. Назначение для вывода или хранения принимаемых данных изменяется в зависимости от типа принимаемых данных. Следует отметить, что схема, выделенная для управления модулем 53 переключения, может предоставляться вместо главного модуля 6 управления.
IF-модуль 51 потоков в устройстве, демультиплексор 52 и модуль 53 переключения описаны как характерная структура процессора 5 потоков. Тем не менее, процессор 5 потоков дополнительно может содержать механизм шифрования, модуль управления безопасностью, контроллер для прямого доступа к памяти и т.п. Механизм шифрования принимает и расшифровывает зашифрованные данные, ключевые данные и т.п. Модуль управления безопасностью сохраняет закрытый ключ и управляет выполнением протокола аутентификации устройств и т.п. между носителем и устройством воспроизведения. В примере, описанном выше, когда данные, принимаемые с носителя, сохраняются в запоминающее устройство 2, модуль 53 переключения изменяет назначение для хранения данных в зависимости от того, являются данные данными для просмотра левым глазом или данными для просмотра правым глазом. Альтернативно, после того, как данные, принимаемые с носителя, временно сохраняются в запоминающем устройстве 2, данные могут разделяться на данные для просмотра левым глазом и данные для просмотра правым глазом в ходе передачи в демультиплексор 52.
Фиг. 113 является функциональной блок-схемой, показывающей характерную структуру модуля 8 AV-вывода. Модуль 8 AV-вывода содержит модуль 81 наложения изображений, модуль 82 преобразования форматов видеовывода и IF-модуль 83 аудио/видеовывода.
Модуль 81 наложения изображений накладывает декодированные видеоданные. В частности, модуль 81 наложения изображений накладывает данные PG (субтитров) и данные IG (меню) на видеоданные для просмотра левым глазом и видеоданные для просмотра правым глазом изображение за изображением. Модель модуля 81 наложения изображений показывается, например, на фиг. 47.
Фиг. 114 является принципиальной схемой, показывающей один пример способа использования запоминающего устройства 2 во время процесса наложения изображений. Запоминающее устройство 2 включает в себя область хранения данных плоскости, соответствующих виду для просмотра левым глазом, область хранения данных плоскости, соответствующих виду для просмотра правым глазом, область хранения данных плоскости, соответствующих графике, и область хранения данных наложенных изображений. Каждая область хранения данных плоскости является областью, в которой декодированные данные временно сохраняются до рендеринга в соответствующей плоскости. Область хранения данных наложенных изображений является областью, в которой сохраняются данные, являющиеся результатом наложения графической плоскости на плоскость для просмотра левым глазом или плоскость для просмотра правым глазом. Следует отметить, что каждая плоскость может быть областью в запоминающем устройстве 2 или виртуальным пространством.
Фиг. 115 и 116 являются принципиальными схемами, показывающими процессы наложения изображений посредством использования запоминающего устройства 2, показанного на фиг. 114. Модуль 81 наложения изображений сначала предоставляет для графической плоскости на основе информации смещения, включенной в метаданные, извлеченные посредством процессора 7 сигналов. Модуль 81 наложения изображений затем накладывает графическую плоскость со смещением на видеоплоскость. В частности, фиг. 115 показывает то, что, модуль 81 наложения изображений предоставляет смещение +X для графической плоскости и затем накладывает графическую плоскость на плоскость для просмотра левым глазом. С другой стороны, фиг. 116 показывает то, что модуль 81 наложения изображений предоставляет смещение -X для исходной графической плоскости и затем накладывает графическую плоскость на плоскость для просмотра правым глазом. Значение X является значением смещения и представляется посредством числа пикселов. Эти процессы наложения, как показано на чертежах, дают возможность комбинирования друг с другом фрагментов данных пикселов, расположенных в идентичных горизонтальных координатах. Данные после наложения сохраняются в области хранения данных наложенных изображений в запоминающем устройстве 2.
Фиг. 117 является принципиальной схемой, показывающей другой пример способа использования запоминающего устройства 2 во время процесса наложения изображений. Запоминающее устройство 2 дополнительно включает в себя "области хранения данных плоскости, соответствующих графике со смещением (для наложенных видов для просмотра левым и правым глазом)". Графические плоскости со смещениями должны временно сохраняться в эти области хранения данных плоскости перед наложением на плоскости для просмотра левым глазом и правым глазом. Например, модуль 81 наложения изображений предоставляет смещение +X для графической плоскости и временно сохраняет графическую плоскость в "область хранения данных плоскости, соответствующих графике со смещением (для наложенного вида для просмотра левым глазом)". Модуль 81 наложения изображений затем считывает графическую плоскость из области хранения данных плоскости, накладывает графическую плоскость на плоскость для просмотра левым глазом и сохраняет результат наложения в область хранения данных наложенных изображений. С другой стороны, модуль 81 наложения изображений предоставляет смещение -X для графической плоскости и временно сохраняет данные плоскости в "область хранения данных плоскости, соответствующих графике со смещением (для наложенного вида для просмотра правым глазом)". Модуль 81 наложения изображений затем считывает графическую плоскость из области хранения данных плоскости, накладывает графическую плоскость на плоскость для просмотра правым глазом и сохраняет результат наложения в область хранения данных наложенных изображений.
Модуль 82 преобразования форматов видеовывода обрабатывает видеоданные процессов после декодирования или наложения, по мере необходимости, с помощью изменения размеров, IP-преобразования, уменьшения уровня шума, преобразования частоты кадров и т.п. Изменение размеров является процессом для того, чтобы увеличивать или уменьшать размеры изображений. IP-преобразование является процессом для того, чтобы преобразовывать между построчным сканированием и чересстрочным сканированием. Уменьшение уровня шума является процессом для того, чтобы удалять шум из изображений. Преобразование частоты кадров является процессом для того, чтобы изменять частоты кадров. Модуль 82 преобразования форматов видеовывода отправляет данные после обработки в модуль 81 наложения изображений или IF-модуль 83 аудио/видеовывода.
IF-модуль 83 аудио/видеовывода преобразует видеоданные, обрабатываемые посредством модуля 82 преобразования форматов видеовывода, и декодированные аудиоданные в предварительно определенные форматы передачи данных посредством процесса кодирования и т.п. Следует отметить, что часть IF-модуля 83 аудио/видео-вывода может быть предусмотрена внешне по отношению к интегральной схеме 3, как описано ниже.
Фиг. 118 является подробной функциональной блок-схемой модуля 8 AV-вывода и модуля вывода данных в устройстве воспроизведения. Модуль 8 AV-вывода и модуль вывода данных в устройстве воспроизведения поддерживают множество форматов передачи данных. Как показано на фиг. 118, IF-модуль 83 аудио/видеовывода включает в себя IF-модуль 83a аналогового видеовывода, IF-модуль 83c аналогового аудиовывода и IF-модуль 83b цифрового видео/аудиовывода.
IF-модуль 83 аналогового видеовывода преобразует видеоданные, обрабатываемые посредством модуля 82 преобразования форматов видеовывода, в формат аналогового видеосигнала и затем выводит видеоданные. IF-модуль 83a аналогового видеовывода включает в себя, например, композитный видеокодер, поддерживающий один из форматов NTSC, PAL и SECAM, кодер для сигнала S-видео (с Y/C-разделением), кодер для компонентного видеосигнала и цифро-аналоговый преобразователь (DAC).
IF-модуль 83b цифрового аудио/видеовывода объединяет декодированные аудиоданные и видеоданные, обрабатываемые посредством модуля 82 преобразования форматов видеовывода, и дополнительно шифрует объединенные данные. После этого IF-модуль 83b цифрового аудио/видеовывода кодирует и выводит зашифрованные данные в соответствии со стандартами передачи данных. Например, модуль HDMI-связи, показанный на фиг. 42, соответствует IF-модулю 83b цифрового видео/аудиовывода.
IF-модуль 83c аналогового аудиовывода обрабатывает декодированные аудиоданные с помощью цифро-аналогового преобразования и затем выводит аналоговые аудиоданные. Аудио-DAC и т.п. соответствует IF-модулю 83c аналогового аудиовывода.
Модуль 8 AV-вывода и модуль вывода данных в устройстве воспроизведения могут изменять форматы передачи видеоданных и аудиоданных в зависимости от устройств приема данных или терминалов ввода данных, которые поддерживают дисплейное устройство и динамик 4. Модуль 8 AV-вывода и модуль вывода данных в устройстве воспроизведения также могут давать возможность пользователю выбирать форматы их передачи. Кроме того, они могут передавать данные, преобразованные из одного содержимого, не только в один формат передачи, но также в два или более форматов передачи параллельно.
Модуль 81 наложения изображений, модуль 82 преобразования форматов видеовывода и IF-модуль 83 аудио/видеовывода описаны как характерная структура модуля 8 AV-вывода. Тем не менее, модуль 8 AV-вывода дополнительно может содержать графический механизм и т.п. Графический механизм обрабатывает данные, декодированные посредством процессора 7 сигналов, с помощью графической обработки, такой как фильтрация, комбинирование экранов, рисование кривых и трехмерное отображение.
На этом завершается описание структуры устройства воспроизведения согласно варианту осуществления 4. Следует отметить, что все вышеописанные функциональные блоки не обязательно должны быть встроенными на интегральной схеме 3. Наоборот, запоминающее устройство 2 может быть встроенным на интегральной схеме 3. Вышеприведенное описание варианта осуществления 4 поясняет главный модуль 6 управления и процессор 7 сигналов как отдельные функциональные блоки. Тем не менее, главный модуль 6 управления может выполнять часть обработки, которую должен выполнять процессор 7 сигналов.
Топология соединений на основе шины управления и шины данных между функциональными блоками в интегральной схеме 3, может выбираться, чтобы удовлетворять процедуре и подробностям обработки посредством функциональных блоков. Фиг. 119A и 119B являются принципиальными схемами, показывающими примеры топологии шины управления и шины данных в интегральной схеме 3. Как показано на фиг. 119A, и шина 21 управления и шина 22 данных выполнены так, что каждый из функциональных блоков 5-9 непосредственно соединяется со всеми другими функциональными блоками. Альтернативно, как показано на фиг. 119B, шина 23 данных выполнена так, что каждый из функциональных блоков 5-8 непосредственно соединяется только с модулем 9 управления запоминающим устройством. В этом случае, каждый из функциональных блоков 5-8 передает данные в другие функциональные блоки через модуль 9 управления запоминающим устройством и дополнительно запоминающее устройство 2.
Интегральная схема 3 может быть многокристальным модулем, вместо LSI, реализованной на однокристальной схеме. В этом случае, множество микросхем, составляющих интегральную схему 3, запаиваются в одном комплекте, и тем самым интегральная схема 3 аналогична одной LSI. Альтернативно, интегральная схема 3 может быть выполнена посредством использования программируемой пользователем вентильной матрицы (FPGA) или реконфигурируемого процессора. FPGA является LSI, программируемой после изготовления. Реконфигурируемый процессор - это LSI, которая дает возможность переконфигурирования соединений между внутренними схемными элементами и настроек для каждого схемного элемента.
<Включение интегральной схемы 3 в дисплейное устройство>
Интегральная схема, аналогичная вышеописанной интегральной схеме 3, может быть включена в дисплейное устройство, чтобы инструктировать дисплейному устройству выполнять вышеописанную обработку посредством устройства воспроизведения согласно варианту осуществления 4. Фиг. 120 является функциональной блок-схемой, показывающей структуру интегральной схемы, включенной в дисплейное устройство, и окружающих модулей. Как показано на фиг. 20, интегральная схема 3 использует IF-модуль 1 носителя и запоминающее устройство 2, чтобы обрабатывать данные, принимаемые посредством IF-модуля 1 носителя, с помощью обработки, аналогичной вышеописанной обработке сигналов. Видеоданные, обрабатываемые посредством интегральной схемы 3, отправляются в модуль 10 возбуждения дисплея. Модуль 10 возбуждения дисплея управляет дисплейной панелью 11 в соответствии с видеоданными. Как результат, видеоданные выводятся как изображения на экране дисплейной панели 11. С другой стороны, аудиоданные, обрабатываемые посредством интегральной схемы 3, выводятся как звуки через динамик 12.
Фиг. 121 является подробной функциональной блок-схемой модуля 8 AV-вывода, показанного на фиг. 120. Модуль 8 AV-вывода включает в себя IF-модуль 84 видеовывода и IF-85 модуль аудиовывода, в отличие от модуля AV-вывода, показанного на фиг. 118. IF-модуль 84 видеовывода и IF-85 модуль аудиовывода могут предоставляться внутри или снаружи интегральной схемы 3. IF-модуль 84 видеовывода передает видеоданные из модуля 82 преобразования форматов видеовывода в модуль 10 возбуждения дисплея. IF-85 модуль аудиовывода передает аудиоданные из процессора 7 сигналов на динамик 12. Следует отметить, что два или более модулей, каждый из которых является аналогичным IF-модулю 84 видеовывода или IF-модулю аудиовывода 85, могут предоставляться. Помимо этого, IF-модуль 84 видеовывода и IF-85 модуль аудиовывода могут быть интегрированы в одном модуле.
<Обработка воспроизведения посредством устройства воспроизведения с использованием интегральной схемы 3>
Фиг. 122 является блок-схемой последовательности операций способа обработки воспроизведения посредством устройства воспроизведения с использованием интегральной схемы 3. Обработка воспроизведения начинается, когда IF-модуль 1 носителя соединяется с носителем, чтобы иметь возможность принимать данные с него, например, когда оптический диск вставляется в накопитель. Во время обработки воспроизведения устройство воспроизведения принимает и декодирует данные с носителя. Устройство 102 воспроизведения далее выводит декодированные данные как видеосигнал и аудиосигнал.
На этапе S1, IF-модуль 1 носителя принимает или считывает данные с носителя и передает данные в процессор 5 потоков. Обработка затем переходит к этапу S2.
На этапе S2, процессор 5 потоков выделяет видеоданные и аудиоданные из данных, принимаемых или считываемых на этапе S1. Обработка затем переходит к этапу S3.
На этапе S3, процессор 7 сигналов декодирует каждый тип данных, разделенных на этапе S2, посредством способа, подходящего для способа кодирования данных. Параллельно с декодированием процессор 7 сигналов дополнительно извлекает метаданные из данных для просмотра правым глазом и сообщает метаданные в модуль 8 AV-вывода. Следует отметить, что процессор 7 сигналов может отслеживать флаги TS-приоритета TS-пакетов, включенных в данные для просмотра правым глазом, чтобы выбирать TS-пакеты, содержащие метаданные. Альтернативно, процессор 7 сигналов может инструктировать одному декодеру как декодировать TS-пакеты в данные несжатых изображений, так и извлекать метаданные из TS-пакетов. Обработка затем переходит к этапу S4.
На этапе S4, модуль 8 AV-вывода накладывает видеоданные, декодированные на этапе S3. По мере необходимости, модуль 8 AV-вывода извлекает и использует информацию смещения из метаданных, извлеченных на этапе S3. Обработка затем переходит к этапу S5.
На этапе S5, модуль 8 AV-вывода выводит видеоданные и аудиоданные, обработанные на этапах S2-S4. Обработка затем переходит к этапу S6.
На этапе S6, главный модуль 6 управления определяет то, продолжать или нет обработку воспроизведения. Обработка снова продолжается с этапа S1, например, когда данные, которые должны приниматься или считываться посредством IF-модуля 1 носителя, остаются в носителе. С другой стороны, обработка завершается, когда IF-модуль 1 носителя завершает прием или считывание данных с носителя, поскольку, например, оптический диск извлечен из накопителя или пользователю инструктировано прекращать воспроизведение.
Фиг. 123 является блок-схемой последовательности операций способа, показывающей подробности этапов S1-S6, показанных на фиг. 122. Этапы S101-S110, показанные на фиг. 123, выполняются под управлением главного модуля 6 управления. Этапы S101-S103, главным образом, соответствуют подробностям этапа S1, этапы S10 - подробностям этапа S2, этап S105 - подробностям этапа S3, этапы S106-S108 - подробностям этапа S4, а этапы S109 и S110 - подробностям этапа S5.
На этапе S101, перед приемом или считыванием данных, которые должны воспроизводиться, с носителя через IF-модуль 1 носителя, IF-модуль 51 потоков в устройстве принимает или считывает данные, требуемые для обработки воспроизведения, такие как файл списков воспроизведения, файл информации о клипах и т.п., с носителя через IF-модуль 1 носителя. IF-модуль 51 потоков в устройстве дополнительно сохраняет требуемые данные в запоминающее устройство 2 через модуль 9 управления запоминающим устройством. Обработка затем переходит к этапу S102.
На этапе S102, главный модуль 6 управления идентифицирует форматы кодирования видеоданных и аудиоданных, сохраненных в носителе, на основе информации атрибутов потока, включенной в файл информации о клипах. Главный модуль 6 управления дополнительно инициализирует процессор 7 сигналов, чтобы иметь возможность выполнять декодирование способом, соответствующим идентифицированному формату кодирования. Обработка затем переходит к этапу S103.
На этапе S103, IF-модуль 51 потоков в устройстве принимает или считывает видео- и аудиоданные, которые должны воспроизводиться, с носителя через IF-модуль 1 носителя. В частности, данные принимаются или считываются экстент за экстентом. IF-модуль 51 потоков в устройстве дополнительно сохраняет данные в запоминающее устройство 2 через модуль 53 переключения и модуль 9 управления запоминающим устройством. В частности, когда данные для просмотра левым глазом принимаются или считываются, главный модуль 6 управления управляет модулем 53 переключения, чтобы переключать назначение для хранения данных для просмотра левым глазом на первую область в запоминающем устройстве 2. С другой стороны, когда данные для просмотра правым глазом принимаются или считываются, главный модуль 6 управления управляет модулем 53 переключения, чтобы переключать назначение для хранения данных для просмотра правым глазом на вторую область в запоминающем устройстве 2. Обработка затем переходит к этапу S104.
На этапе S104, данные, сохраненные в запоминающем устройстве 2, передаются в демультиплексор 52 в процессоре 5 потоков. Демультиплексор 52 сначала считывает PID из исходных пакетов, составляющих данные. Демультиплексор 52 затем использует PID для того, чтобы отличать то, являются TS-пакеты, включенные в исходные пакеты, видеоданными или аудиоданными. Демультиплексор 52 дополнительно передает каждый TS-пакет в соответствующий декодер в процессоре 7 сигналов в зависимости от результата различения. Следует отметить, что процессор 7 сигналов может отслеживать флаги TS-приоритета TS-пакетов, включенных в данные для просмотра правым глазом, чтобы отправлять TS-пакеты, содержащие метаданные, в выделенный модуль, отдельный от декодера первичного видео, т.е. процессора метаданных смещения. Обработка затем переходит к этапу S105.
На этапе S105, каждый декодер в процессоре 7 сигналов декодирует передаваемые TS-пакеты с помощью соответствующего способа. Параллельно с декодированием процессор 7 сигналов дополнительно извлекает метаданные из данных для просмотра правым глазом и сообщает метаданные в модуль 8 AV-вывода. Следует отметить, что извлечение может выполняться посредством процессора метаданных смещения, отдельного от декодера первичного видео, или может выполняться посредством декодера первичного видео одновременно с декодированием. Обработка затем переходит к этапу S106.
На этапе S106, изображения видеопотока для просмотра левым глазом и видеопотока для просмотра правым глазом, декодированные посредством процессора 7 сигналов, отправляются в модуль 82 преобразования форматов видеовывода. Модуль 82 преобразования форматов видеовывода изменяет размеры изображений так, чтобы совпадать с разрешением дисплейного устройства 4. Обработка затем переходит к этапу S107.
На этапе S107, модуль 81 наложения изображений принимает данные видеоплоскости, состоящие из изображений, измененных на этапе S106, из модуля 82 преобразования форматов видеовывода. Модуль 81 наложения изображений также принимает декодированные данные PG- и IG-плоскости из процессора 7 сигналов. Модуль 81 наложения изображений дополнительно накладывает декодированные данные PG- и IG-плоскости. Обработка затем переходит к этапу S108.
На этапе S108, модуль 82 преобразования форматов видеовывода принимает данные плоскости, наложенные на этапе S107, из модуля 81 наложения изображений. Модуль 82 преобразования форматов видеовывода дополнительно обрабатывает данные плоскости с помощью IP-преобразования. Обработка затем переходит к этапу S109.
На этапе S109, IF-модуль 83 аудио/видеовывода принимает видеоданные, обработанные с помощью IP-преобразования на этапе S108, из модуля 82 преобразования форматов видеовывода и принимает декодированные аудиоданные из процессора 7 сигналов. IF-модуль 83 аудио/видеовывода дополнительно обрабатывает видео- и аудиоданные с помощью кодирования, цифро-аналогового преобразования и т.п. в соответствии со способом вывода данных посредством дисплейного устройства и динамика 4 и способом передачи данных на дисплейное устройство и в динамик 4. С помощью этих процессов, видеоданные и аудиоданные преобразуются в аналоговый формат вывода или цифровой формат вывода. Видеоданные в аналоговом формате вывода включают в себя композитный видеосигнал, сигнал S-видео, компонентный видеосигнал и т.п. Кроме того, HDMI и т.п. поддерживается как цифровой формат вывода. Обработка затем переходит к этапу S110.
На этапе S110, IF-модуль 83 аудио/видеовывода передает видеоданные и аудиоданные, обработанные на этапе S109, на дисплейное устройство и в динамик динамику 4. Обработка затем переходит к этапу S6. Подробности этапа S6 могут быть обнаружены в вышеприведенном описании.
На каждом из вышеописанных этапов, каждый раз, когда обрабатываются данные, данные могут временно сохраняться в запоминающее устройство 2. Изменение размеров и IP-преобразование посредством модуля 82 преобразования форматов видеовывода на этапах S106 и S108 могут пропускаться, если не требуется. Вместо или помимо этих процессов, дополнительно могут выполняться другие процессы, такие как уменьшение уровня шума и преобразование частоты кадров. Помимо этого, порядок процессов может изменяться в максимально возможных пределах.
Когда дисплейное устройство, показанное на фиг. 120, используется при обработке воспроизведения, блок-схема последовательности операций способа обработки воспроизведения в основном является аналогичной блок-схеме последовательности операций способа, показанной на фиг. 122 и 123. Функциональные блоки, показанные на фиг. 120 и 121, работают аналогично функциональным блокам, показанным на фиг. 110 и 113.
<<Дополнительное пояснение>>
<Принцип воспроизведения трехмерных видеоизображений>
Способы воспроизведения трехмерных видеоизображений примерно классифицируются на две категории: способы с использованием голографической технологии и способы с использованием параллактического видео.
Способ с использованием голографической технологии отличается предоставлением возможности зрителю воспринимать объекты в видео как стереоскопические посредством предоставления зрителю визуального восприятия информации, практически идентичной оптической информации, предоставленной для визуального восприятия людьми фактических объектов. Техническая теория для использования этих способов для отображения движущегося видео установлена. Тем не менее, чрезвычайно трудно создавать, с помощью настоящей технологии, компьютер, который допускает обработку в реальном времени огромного объема вычислений, требуемого для отображения движущегося видео, и дисплейное устройство, имеющего сверхвысокое разрешение нескольких тысяч линий на 1 мм. Соответственно, в настоящее время реализация этих способов для коммерческого использования практически не рассматривается.
"Параллактическое видео" означает пару двумерных видеоизображений, показанных каждому из глаз зрителя для одной сцены, т.е. пару из вида для просмотра левым глазом и вида для просмотра правым глазом. Способ с использованием параллактического видео отличается посредством воспроизведения вида для просмотра левым глазом и вида для просмотра правым глазом одной сцены так, что зритель видит каждый вид только в одном глазу, тем самым давая возможность пользователю воспринимать сцену как стереоскопическую.
Фиг. 82A, 82B и 82C являются схематичными представлениями, иллюстрирующими принцип в отношении воспроизведения трехмерных видеоизображений (стереоскопических видеоизображений) в способе с использованием параллактических видеоизображений. Фиг. 82A является видом сверху зрителя VWR, смотрящего на куб CBC, размещенный непосредственно перед лицом зрителя. Фиг. 82B и 82C являются схематичными представлениями, показывающими внешний вид куба CBC как двумерное видеоизображение, воспринимаемое, соответственно, посредством левого глаза LEY и правого глаза REY зрителя VWR. Как очевидно из сравнения фиг. 82B и фиг. 82C, внешние виды куба CBC, воспринимаемые посредством глаз, немного отличаются. Различие внешних видов, т.е. бинокулярный параллакс дает возможность зрителю VWR распознавать куб CBC как трехмерный. Таким образом, согласно способу с использованием параллактического видео, левое и правое двумерные видеоизображения с различными точками обзора сначала подготавливаются для одной сцены. Например, для куба CBC, показанного на фиг. 82A, вид для просмотра левым глазом куба CBC, показанный на фиг. 82B, и вид для просмотра правым глазом, показанный на фиг. 73C, подготавливаются. В этом контексте позиция каждой точки обзора определяется посредством бинокулярного параллакса зрителя VWR. Затем, каждое двумерное видеоизображение воспроизводится так, чтобы восприниматься только посредством соответствующего глаза зрителя VWR. Следовательно, зритель VWR распознает сцену, воспроизводимую на экране, т.е. видеоизображение куба CBC, как стереоскопическую. В отличие от способов с использованием голографической технологии, способы с использованием параллактического видео тем самым обладают преимуществом обязательности подготовки двумерных видеоизображений просто с двух точек обзора.
Предложено несколько конкретных способов для того, как использовать параллактического видео. С точки зрения того, как эти способы показывают левое и правое двумерные видеоизображения глазам зрителя, способы разделяются на способы поочередной последовательности кадров, способы, которые используют ступенчатую линзу, способы двухцветного разделения и т.д.
В способе поочередной последовательности кадров, левое и правое двумерные видеоизображения поочередно отображаются на экране в течение предварительно определенного времени в момент, когда зритель смотрит на экран с использованием очков с затвором. Каждая линза в очках с затвором формируется, например, посредством жидкокристаллической панели. Линзы пропускают или блокируют свет равномерно и поочередно синхронно с переключением видеоизображения на экране. Таким образом, каждая линза выступает в качестве затвора, который периодически блокирует глаз зрителя. Более конкретно, в то время, когда левое видеоизображение отображается на экране, очки с затвором заставляют левую линзу пропускать свет, а правую линзу блокировать свет. В отличие от этого, то время, когда правое видеоизображение отображается на экране, очки с затвором заставляют правую линзу пропускать свет, а левую линзу блокировать свет. Как результат, зритель видит послеизображения правых и левых видеоизображений, наложенных друг на друга, и тем самым воспринимает одно трехмерное видеоизображение.
Согласно способу поочередной последовательности кадров, как описано выше, правое и левое видеоизображения поочередно отображаются с предварительно определенным циклом. Например, когда 24 видеокадра отображаются в секунду для воспроизведения обычных двумерных видеоизображений, 48 видеокадров всего для правого и левого глаза должно отображаться для трехмерных видеоизображений. Соответственно, дисплейное устройство, допускающее быстрое выполнение перезаписи экрана, является предпочтительным для этого способа.
В способе с использованием ступенчатой линзы, правый видеокадр и левый видеокадр, соответственно, разделяются на вертикально длинные и узкие небольшие области прямоугольной формы. Небольшие области правого видеокадра и небольшие области левого видеокадра поочередно размещаются в горизонтальном направлении на экране и отображаются одновременно. Поверхность экрана покрывается посредством ступенчатой линзы. Ступенчатая линза - это линза в форме пластины, состоящая из размещенных параллельно нескольких длинных и тонких выпуклых линз. Каждая выпуклая линза располагается в продольном направлении на поверхности экрана. Когда зритель видит левый и правый видеокадры через ступенчатую линзу, только левый глаз зрителя воспринимает свет из областей отображения левого видеокадра, и только правый глаз зрителя воспринимает свет из областей отображения правого видеокадра. Зритель тем самым видит трехмерное видеоизображение из бинокулярного параллакса между видеоизображениями, соответственно, воспринимаемыми посредством левого и правого глаза. Следует отметить, что согласно этому способу, другой оптический компонент, имеющий аналогичные функции, такой как жидкокристаллическое устройство, может использоваться вместо ступенчатой линзы. Альтернативно, например, продольный поляризационный фильтр может предоставляться в областях отображения кадра с левым изображением, и боковой поляризационный фильтр может предоставляться в областях отображения кадра с правым изображением. В этом случае, зритель видит экран через поляризационные очки. В поляризационных очках продольный поляризационный фильтр предоставляется для левой линзы, а боковой поляризационный фильтр предоставляется для правой линзы. Следовательно, правое и левое видеоизображения воспринимаются только посредством соответствующих глаз, тем самым давая возможность зрителю воспринимать трехмерные видеоизображения.
В способе с использованием параллактического видео, помимо составления с начала посредством комбинации левых и правых видеоизображений, трехмерное видеосодержимое также может состоять из комбинации двумерных видеоизображений и карты глубины. Двумерные видеоизображения представляют трехмерные видеоизображения, проецируемые на гипотетический двумерный экран, и карта глубины представляет глубину каждого пиксела в каждой части трехмерных видеоизображений по сравнению с двумерным экраном. Когда трехмерное содержимое составляется из комбинации двумерных видеоизображений с картой глубины, устройство трехмерного воспроизведения или дисплейное устройство сначала составляет левое и правое видеоизображения из комбинации двумерных видеоизображений с картой глубины и затем создает трехмерные видеоизображения из этих левых и правых видеоизображений с использованием одного из вышеописанных способов.
Фиг. 83 является схематичным представлением, показывающим пример составления вида LVW для просмотра левым глазом и вида RVW для просмотра правым глазом из комбинации двумерного видеоизображения MVW и карты DPH глубины. Как показано на фиг. 83, круглый диск DSC показывается в фоне BGV двумерного видеоизображения MVW. Карта DPH глубины указывает глубину для каждого пиксела в каждой части двумерного видеоизображения MVW. Согласно карте DPH глубины, в двумерном видеоизображении MVW область отображения DA1 круглого диска DSC ближе к зрителю, чем экран, а область отображения DA2 фона BGV глубже экрана. Модуль PDG формирования параллактического видео в устройстве воспроизведения сначала вычисляет бинокулярный параллакс для каждой части двумерного видеоизображения MVW с использованием глубины каждой части, указываемой посредством карты DPH глубины. Затем, модуль PDG формирования параллактического видео сдвигает позицию представления каждой части в двумерном видеоизображении MVW влево или вправо в соответствии с вычисленным бинокулярным параллаксом, чтобы составлять вид LVW для просмотра левым глазом и вид RVW для просмотра правым глазом. В примере, показанном на фиг. 83, модуль PDG формирования параллактического видео сдвигает позицию представления круговой пластины DSC в двумерном видеоизображении 6601 следующим образом: позиция представления круговой пластины DSL в виде LVW для просмотра левым глазом сдвигается вправо на половину своего бинокулярного параллакса, S1, и позиция представления круговой пластины DSR в виде RVW для просмотра правым глазом сдвигается влево на половину своего бинокулярного параллакса, S1. Таким образом, зритель воспринимает круговую пластину DSC как находящуюся ближе к экрану. В отличие от этого, модуль PDG формирования параллактического видео сдвигает позицию представления фона BGV в двумерном видеоизображении MVW следующим образом: позиция представления фона BGL в виде LVW для просмотра левым глазом сдвигается влево на половину своего бинокулярного параллакса, S2, и позиция представления фона BGR в виде RVW для просмотра правым глазом сдвигается вправо на половину своего бинокулярного параллакса, S2. Таким образом, зритель воспринимает фон BGV как глубже экрана.
Система воспроизведения для трехмерных видеоизображений с использованием параллактического видео уже широко используется, устанавливаясь для применения в кинотеатрах, парках с аттракционами и т.п. Соответственно, этот способ также полезен для реализации систем домашнего кинотеатра, которые могут воспроизводить трехмерные видеоизображения. В вариантах осуществления настоящего изобретения, из способов с использованием параллактического видео, способ поочередной последовательности кадров или способ с использованием поляризационных очков предположительно должны использоваться. Тем не менее, помимо этих способов, настоящее изобретение также может применяться к другим отличающимся способам до тех пор, пока они используют параллактическое видео. Это должно быть очевидным для специалистов в данной области техники из вышеуказанного пояснения вариантов осуществления.
<Файловая система на BD-ROM-диске>
Когда UDF используется в качестве файловой системы для BD-ROM-диска 101, область 202B тома, показанная на фиг. 2, в общем, включает в себя области, на которые, соответственно, записывается множество каталогов, дескриптор набора файлов и конечный дескриптор. Каждый "каталог" является группой данных, составляющей каталог. "Дескриптор набора файлов" указывает LBN сектора, в котором сохраняется запись файла для корневого каталога. "Конечный дескриптор" указывает конец области записи для дескриптора набора файлов.
Каждый каталог совместно использует общую структуру данных. В частности, каждый каталог включает в себя запись файла, файл каталогов и группу подчиненных файлов.
"Запись файла" включает в себя тег дескриптора, тег блока управления информацией (ICB) и дескриптор выделения. "Тег дескриптора" указывает то, что типом данных, которые включают в себя тег дескриптора, является запись файла. Например, когда значение тега дескриптора равно "261", типом этих данных является запись файла. "ICB-тег" указывает информацию атрибутов записи файлов. "Дескриптор выделения" указывает LBN сектора, в котором записан файл каталогов, принадлежащий этому каталогу.
"Файл каталогов" типично включает в себя множество из каждого из дескрипторов идентификатора файла для подчиненного каталога и дескрипторов идентификатора файла для подчиненного файла. "Дескриптор идентификатора файла для подчиненного каталога" является информацией для осуществления доступа к подчиненному каталогу, расположенному непосредственно в рамках этого каталога. Этот дескриптор идентификатора файла включает в себя идентификационную информацию для подчиненного каталога, длину имени каталога, адрес записи файла и фактическое имя каталога. В частности, адрес записи файла указывает LBN сектора, в котором записывается запись файла подчиненного каталога. "Дескриптор идентификатора файла для подчиненного файла" является информацией для осуществления доступа к подчиненному файлу, расположенному непосредственно в рамках этого каталога. Этот дескриптор идентификатора файла включает в себя идентификационную информацию для подчиненного файла, длину имени файла, адрес записи файла и фактическое имя файла. В частности, адрес записи файла указывает LBN сектора, в котором записывается запись файла подчиненного файла. "Запись файла подчиненного файла", как описано ниже, включает в себя информацию адреса для данных, составляющих фактический подчиненный файл.
Посредством отслеживания дескрипторов набора файлов и дескрипторов идентификаторов файлов подчиненных каталогов/файлов по порядку может осуществляться доступ к записи файла случайного каталога/файла, записанного в области 202B тома. В частности, запись файла корневого каталога сначала указывается из дескриптора набора файлов, и файл каталогов для корневого каталога указывается из дескриптора выделения в этой записи файла. Затем, дескриптор идентификатора файла для каталога непосредственно в рамках корневого каталога обнаруживается из файла каталогов, и запись файла для этого каталога указывается из адреса записи файла в нем. Кроме того, файл каталогов для этого каталога указывается из дескриптора выделения в записи файла. Затем, изнутри файла каталогов, запись файла для подчиненного каталога или подчиненного файла указывается из адреса записи файла в дескрипторе идентификатора файла для этого подчиненного каталога или подчиненного файла.
"Подчиненные файлы" включают в себя экстенты и записи файлов. "Экстентов", как правило, много, и они являются последовательностями данных, логические адреса, т.е. LBN, которых являются последовательными на диске. Экстенты в общем содержат фактический подчиненный файл. "Запись файлов" включает в себя тег дескриптора, ICB-тег и дескрипторы выделения. "Тег дескриптора" указывает то, что типом данных, которые включают в себя тег дескриптора, является запись файла. "ICB-тег" указывает информацию атрибутов записи файлов. "Дескрипторы выделения" предоставляются в соответствии "один-к-одному" с каждым экстентом и указывают компоновку каждого экстента в области 202B тома, а именно размер каждого экстента и LBN для начала экстента. Соответственно, посредством обращения к каждому дескриптору выделения, к каждому экстенту может осуществляться доступ. Кроме того, два старших бита каждого дескриптора выделения указывают то, записан или нет экстент фактически в секторе для LBN, указанного посредством дескриптора выделения. В частности, когда два старших бита равны "0", экстент выделен для местоположения записи и фактически записан в него. Когда два старших бита равны "1", экстент выделен для местоположения записи, но еще не записан в него.
Аналогично вышеописанной файловой системе с применением UDF, когда каждый файл, записанный в область 202B тома, разделяется на множество экстентов, файловая система для области 202B тома также, в общем, хранит информацию, показывающую местоположения экстентов, как и в случае с вышеуказанными дескрипторами выделения, в области 202B тома. Посредством обращения к этой информации, местоположение каждого экстента, в частности, его логический адрес, может быть обнаружено.
<Размер блоков данных и блоков экстентов>
Как показано на фиг. 19, мультиплексированные потоковые данные на BD-ROM-диске 101 компонуются посредством разделения на блоки D[n] данных для воспроизведения зависимого вида и блоки B[n] данных для воспроизведения базового вида (n=0, 1, 2, 3, ...). Кроме того, эти группы D[n] и B[n] блоков данных записываются последовательно на дорожке в перемеженной компоновке, чтобы формировать множество блоков 1901-1903 экстентов. Чтобы обеспечивать плавное воспроизведение как двумерных видеоизображений, так и трехмерных видеоизображений из этих блоков 1901-1903 экстентов, размер каждого блока данных и каждого блока 1901-1903 экстентов должен удовлетворить следующим условиям на основе характеристик устройства 102 воспроизведения.
<<Условия на основе характеристик в режиме двумерного воспроизведения>>
Фиг. 84 является блок-схемой, показывающей обработку воспроизведения в устройстве 102 воспроизведения в режиме двумерного воспроизведения. Как показано на фиг. 84, эта система обработки воспроизведения включает в себя BD-ROM-накопитель 3701, буфер 3721 считывания и декодер 4225 системных целевых объектов, показанные на фиг. 37. BD-ROM-накопитель 3701 считывает двумерные экстенты из BD-ROM-диска 101 и передает двумерные экстенты в буфер 3721 считывания на скорости RUD54 считывания. Декодер 4225 системных целевых объектов считывает исходные пакеты из каждого двумерного экстента, сохраненного в буфере 3721 считывания, на средней скорости REXT2D передачи и декодирует исходные пакеты на видеоданные VD и аудиоданные AD.
Средняя скорость REXT2D передачи равна 192/188, умноженным на среднюю скорость обработки посредством декодера 4225 системных целевых объектов, чтобы извлекать TS-пакеты из каждого исходного пакета. В общем, эта средняя скорость REXT2D передачи изменяется для каждого двумерного экстента. Максимальное значение RMAX2D средней скорости REXT2D передачи равно 192/188, умноженным на системную скорость RTS для файла 2D. В этом случае, коэффициент 192/188 является отношением байтов в исходном пакете к байтам в TS-пакете. Средняя скорость REXT2D передачи традиционно представляется в битах/сек и конкретно равна значению размера двумерного экстента, выраженного в битах, разделенного на ATC-время экстента. "Размер экстента, выраженный в битах", равен восьми, умноженным на произведение числа исходных пакетов в экстенте и числа байтов в расчете на исходный пакет (=192 байта × 8 бит/байт).
Скорость RUD54 считывания традиционно выражается в битах/сек и задается равной более высокому значению, к примеру, 54 Мбит/с, чем максимальное значение RMAX2D средней скорости REXT2D передачи: RUD54 >RMAX2D. Это предотвращает опустошение в буфере 3721 считывания вследствие обработки декодирования посредством декодера 4225 системных целевых объектов в момент, когда BD-ROM-накопитель 3701 считывает двумерный экстент из BD-ROM-диска 101.
Фиг. 85A является графиком, показывающим изменение объема DA данных, сохраненного в буфере 3721 считывания, в ходе работы в режиме двумерного воспроизведения. Фиг. 85B является схематичным представлением, показывающим соответствие между блоком 8510 экстентов для воспроизведения и путем 8520 воспроизведения в режиме двумерного воспроизведения. Как показано на фиг. 85B, в соответствии с путем 8520 воспроизведения, блоки B[n] данных для воспроизведения базового вида (n=0, 1, 2, ...) в блоке 8510 экстентов считываются как один двумерный экстент EXT2D[n] из BD-ROM-диска 101 в буфер 3721 считывания. Как показано на фиг. 85A, в течение периода PR2D[n] считывания для каждого двумерного экстента EXT2D[n], сохраненный объем DA данных увеличивается на скорости, равной RUD54-REXTCD[n], разности между скоростью RUD54 считывания и средней скоростью REXT2D[n] передачи. Переход J2D[n], тем не менее, осуществляется между двумя смежными двумерными экстентами EXT2D[n-1] и EXT2D[n]. Поскольку считывание двух смежных блоков Dn данных для воспроизведения зависимого вида пропускается в течение соответствующего периода PJ2D[n] перехода, считывание данных из BD-ROM-диска 101 прерывается. Соответственно, сохраненный объем DA данных уменьшается на средней скорости REXT2D[n] передачи в течение каждого периода PJ2D[n] перехода.
Операции считывания и передачи посредством BD-ROM-накопителя 3701 фактически выполняются не непрерывно, как предлагается посредством графика на фиг. 85A, а вместо этого периодически. В течение периода PR2D[n] считывания для каждого двумерного экстента, это препятствует превышению емкости буфера 3721 считывания посредством сохраненного объема DA данных, т.е. переполнению в буфере 3721 считывания. Соответственно, график на фиг. 85A представляет то, что фактически является пошаговым увеличением, как аппроксимированное прямое увеличение.
Чтобы воспроизводить двумерные видеоизображения плавно из блока 8510 экстентов, показанного на фиг. 85B, следующие условия [1] и [2] должны удовлетворяться.
[1] В момент, когда данные непрерывно предоставляются из буфера 3721 считывания в декодер 4225 системных целевых объектов в течение каждого периода PJ2D[n] перехода, непрерывный вывод из декодера 4225 системных целевых объектов должен обеспечиваться. Для этого, следующее условие должно удовлетворяться: размер SEXT2D[n] каждого двумерного экстента EXT2D[n] равен объему данных, передаваемых из буфера 3721 считывания в декодер 4225 системных целевых объектов от периода PR2D[n] считывания через следующий период PJ2D[n+1] перехода. Если это имеет место, то, как показано на фиг. 85A, сохраненный объем DA данных в конце периода PJ2D[n+1] перехода не опускается ниже значения в начале периода PR2D[n] считывания. Другими словами, в течение каждого периода PJ2D[n] перехода, данные непрерывно предоставляются из буфера 3721 считывания в декодер 4225 системных целевых объектов. В частности, опустошение не возникает в буфере 3721 считывания. В этом случае, длина периода PR2D[n] считывания равна SEXT2D[n]/RUD54, значению, полученному посредством деления размера SEXT2D[n] двумерного экстента EXT2D[n] на скорость RUD54 считывания. Соответственно, размер SEXT2D[n] каждого двумерного экстента EXT2D[n] должен быть равным или превышающим минимальным размер экстента, выражаемый в правой стороне выражения 1.
(1)
В выражении 1 время TJUMP-2D[n] перехода представляет длину периода PJ2D[n] перехода в секундах. Скорость RUD54 считывания и средняя скорость REXT2D передачи выражаются в битах в секунду. Соответственно, в выражении 1, средняя скорость REXT2D передачи делится на 8, чтобы преобразовывать размер SEXT2D[n] двумерного экстента из битов в байты. Таким образом, размер SEXT2D[n] двумерного экстента выражается в байтах. Функция CEIL() является операцией, чтобы округлять в большую сторону дробные числа после десятичной запятой для значения в круглых скобках.
[2] Поскольку емкость буфера 3721 считывания является ограниченной, максимальное значение периода TJUMP-2D[n] перехода является ограниченным. Другими словами, даже если сохраненный объем DA данных непосредственно перед периодом PJ2D[n] перехода составляет максимальную емкость буфера 3721 считывания, если время TJUMP-2D[n] перехода является слишком длительным, то сохраненный объем DA данных достигает нуля в течение периода PJ2D[n] перехода, и имеется опасность возникновения опустошения в буфере 3721 считывания. В дальнейшем в этом документе, время для уменьшения сохраненного объема DA данных с максимальной емкости буфера 3721 считывания до нуля в момент, когда предоставление данных из BD-ROM-диска 101 в буфер 3721 считывания прекращено, т.е. максимальное значение времени TJUMP-2D[n] перехода, которое гарантирует плавное воспроизведение, упоминается как "максимальное время TJUMP_MAX перехода".
В стандартах оптических дисков соответствие между расстояниями перехода и максимальными временами перехода определяется из скорости доступа накопителя на оптических дисках и других факторов. Фиг. 86 является примером таблицы соответствия между расстояниями SJUMP перехода и максимальными временами TJUMP_MAX перехода для BD-ROM-диска. Как показано на фиг. 86, расстояния SJUMP перехода представляются в единицах секторов, а максимальные времена TJUMP_MAX перехода представляются в миллисекундах. Один сектор равен 2048 байтам. Когда расстояние SJUMP перехода составляет нуль секторов или находится в диапазоне 1-10000 секторов, 10001-20000 секторов, 20001-40000 секторов, 40001 сектора 1/10 длины хода и 1/10 длины хода или более, соответствующее максимальное время TJUMP_MAX перехода составляет 0 мс, 250 мс, 300 мс, 350 мс, 700 мс и 1400 мс, соответственно. Когда расстояние SJUMP перехода равно нулю секторов, максимальное время TJUMP_MAX перехода равно времени TJUMP0 перехода через нуль секторов. В примере на фиг. 86, время TJUMP0 перехода через нуль секторов рассматривается как нуль мс.
На основе вышеуказанных соображений, временем TJUMP-2D[n] перехода, которое должно подставляться в выражение 1, является максимальное время TJUMP_MAX перехода, указываемое для каждого расстояния перехода посредством стандартов BD-ROM-дисков. В частности, расстояние SJUMP перехода между двумерными экстентами EXT2D[n-1] и EXT2D[n] подставляется в выражение 1 как время TJUMP-2D[n] перехода. Это расстояние SJUMP перехода равно максимальному времени TJUMP_MAX перехода, которое соответствует числу секторов от конца (n+1)-го двумерного экстента EXT2D[n] до начала (n+2)-го двумерного экстента EXT2D[n+1], как обнаружено в таблице на фиг. 86.
Поскольку время TJUMP-2D[n] перехода для перехода между двумя двумерными экстентами EXT2D[n] и EXT2D[n+1], ограничено максимальным временем TJUMP_MAX перехода, расстояние SJUMP перехода, т.е. расстояние между этими двумя двумерными экстентами EXT2D[n] и EXT2D[n+1], также ограничено. Когда время TJUMP перехода равно максимальному времени TJUMP_MAX перехода, расстояние SJUMP перехода достигает максимального значения, называемого "максимальным расстоянием SJUMP_MAX перехода". Для плавного воспроизведения двумерных видеоизображений, в дополнение к размеру двумерных экстентов, удовлетворяющему выражению 1, расстояние между двумерными экстентами должно быть равным или меньшим максимального расстояния SJUMP_MAX перехода.
В рамках каждого блока экстентов расстояние между двумерными экстентами равно размеру блока данных для воспроизведения зависимого вида. Соответственно, этот размер ограничен тем, чтобы быть равным или меньшим максимального расстояния SJUMP_MAX перехода. В частности, когда максимальное время TJUMP_MAX перехода между двумерными экстентами ограничено минимальным значением в 250 мс, указываемым на фиг. 86, то расстояние между двумерными экстентами, т.е. размер блоков данных для воспроизведения зависимого вида, ограничено соответствующим максимальным расстоянием SJUMP_MAX перехода=10000 секторов или менее.
При плавном воспроизведении двух блоков экстентов, размещаемых на различных слоях для записи, длинный переход осуществляется между (n+1)-м двумерным экстентом EXT2D[n], расположенным в конце предыдущего блока экстентов, и (n+2)-рым двумерным экстентом EXT2D[n+1], расположенным в начале последующего блока экстентов. Этот длинный переход вызывается посредством операции, такой как переход к фокусу, чтобы переключать слой для записи. Соответственно, в дополнение к максимальному времени TJUMP_MAX перехода, указываемому в таблице на фиг. 86, время, требуемое для этого длинного перехода, дополнительно включает в себя "время переключения слоев", которое является временем, необходимым для операции, чтобы переключать слой для записи. Это "время переключения слоев" составляет, например, 350 мс. Как результат, в выражении 1, которому должен удовлетворять размер (n+1)-го двумерного экстента EXT2D[n], время TJUMP-2D[n] перехода определяется посредством суммы двух параметров TJ[n] и TL[n]: TJUMP_MAX[n]=TJ[n]+TL[n]. Первый параметр TJ[n] представляет максимальное время TJUMP_MAX перехода, указываемое для расстояния SJUMP перехода для длинного перехода согласно стандартам BD-ROM-дисков. Это максимальное время TJUMP_MAX перехода равно значению, в таблице на фиг. 86, соответствующему числу секторов от конца (n+1)-го двумерного экстента EXT2D[n] до начала (n+2)-го двумерного экстента EXT2D[n+1]. Второй параметр TL[n] представляет время переключения слоев, например, 350 мс. Соответственно, расстояние между двумя двумерными экстентами EXT2D[n] и EXT2D[n+1] ограничено тем, чтобы быть равным или меньшим максимального расстояния SJUMP_MAX перехода, соответствующего, в таблице на фиг. 86, максимальному времени TJUMP_MAX перехода для длинного перехода минус время переключения слоев.
<<Условия на основе характеристик в режиме трехмерного воспроизведения>>
Фиг. 87 является блок-схемой, показывающей обработку воспроизведения в устройстве 102 воспроизведения в режиме трехмерного воспроизведения. Как показано на фиг. 87, из элементов, показанных на фиг. 42, эта система обработки воспроизведения включает в себя BD-ROM-накопитель 4201, переключатель 4220, пару RB1 4221 и RB2 4222 считывания и декодер 4225 системных целевых объектов. BD-ROM-накопитель 4201 считывает экстенты SS из BD-ROM-диска 101 и передает экстенты SS в переключатель 4220 на скорости RUD72 считывания. Переключатель 4220 разделяет экстенты SS на блоки данных для воспроизведения базового вида и блоки данных для воспроизведения зависимого вида. Блоки данных для воспроизведения базового вида сохраняются в RB1 4221, а блоки данных для воспроизведения зависимого вида сохраняются в RB2 4222. Декодер 4225 системных целевых объектов считывает исходные пакеты из блоков данных для воспроизведения базового вида, сохраненных в RB1 4221, на скорости REXT1 передачи для воспроизведения базового вида и считывает исходные пакеты из блоков данных для воспроизведения зависимого вида, сохраненных в RB2 4222, на скорости REXT2 передачи для воспроизведения зависимого вида. Декодер 4225 системных целевых объектов также декодирует пары считанных блоков данных для воспроизведения базового вида и блоков данных для воспроизведения зависимого вида в видеоданные VD и аудиоданные AD.
Скорость REXT1 передачи для воспроизведения базового вида и скорость REXT2 передачи для воспроизведения зависимого вида равны 192/188, умноженным на среднюю скорость обработки посредством декодера 4225 системных целевых объектов, чтобы извлекать TS-пакеты, соответственно, из каждого исходного пакета в блоках данных для воспроизведения базового вида и блоках данных для воспроизведения зависимого вида. Максимальное значение RMAX1 скорости REXT1 передачи для воспроизведения базового вида равно 192/188, умноженным на системную скорость RTS1 для файла 2D. Максимальное значение RMAX2 скорости REXT2 передачи для воспроизведения зависимого вида равно 192/188, умноженным на системную скорость RTS2 для файла DEP. Скорости REXT1 и REXT2 передачи традиционно представляются в битах/сек и конкретно равняются значению размера каждого блока данных, выражаемого в битах, деленному на ATC-время экстента. ATC-время экстента равно времени, необходимому для того, чтобы передавать все исходные пакеты в блоке данных из буферов 4221, 4222 считывания в декодер 4225 системных целевых объектов.
Скорость RUD72 считывания традиционно выражается в битах/сек и задается равной более высокому значению, к примеру, 72 Мбит/с, чем максимальные значения RMAX1, RMAX2 скоростей REXT1, REXT2 передачи: RUD72>RMAX1, RUD72>RMAX2. Это предотвращает опустошение в RB1 4221 и RB2 4222 вследствие обработки декодирования посредством декодера 4225 системных целевых объектов в момент, когда BD-ROM-накопитель 4201 считывает экстент SS из BD-ROM-диска 101.
[Плавное соединение в рамках блока экстентов]
Фиг. 88A и 88B являются графиками, показывающими изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, когда трехмерные видеоизображения воспроизводятся плавно из одного блока экстентов. Фиг. 88C является схематичным представлением, показывающим соответствие между блоком 8810 экстентов и путем 8720 воспроизведения в режиме трехмерного воспроизведения. Как показано на фиг. 88C, в соответствии с путем 8820 воспроизведения, весь блок 8810 экстентов считывается за один раз как один экстент SS. Затем, переключатель 4220 разделяет экстент SS на блоки D[k] данных для воспроизведения зависимого вида и блоки B[k] данных для воспроизведения базового вида (k=..., n, n+1, n+2, ...).
Операции считывания и передачи посредством BD-ROM-накопителя 4201 фактически выполняются не непрерывно, как предлагается посредством графиков на фиг. 88A и 88B, а вместо этого периодически. В течение периодов PRD[k] и PRB[k] считывания для блоков D[k], B[k] данных, это предотвращает переполнение в RB1 4221 и RB2 4222. Соответственно, графики на фиг. 88A и 88B представляют то, что фактически является пошаговым увеличением, как аппроксимированное прямое увеличение.
Как показано на фиг. 88A и 88B, в течение периода PRD[n] считывания n-го блока D[n] данных для воспроизведения зависимого вида, сохраненный объем DA2 данных в RB2 4222 увеличивается на скорости, равной RUD72-REXT2[n], разности между скоростью RUD72 считывания и скоростью REXT2[n] передачи для воспроизведения зависимого вида, при этом сохраненный объем DA1 данных в RB1 4221 уменьшается на скорости REXT1[n-1] передачи для воспроизведения базового вида. Как показано на фиг. 88C, переход J0[2n] через нуль секторов осуществляется от (n+1)-го блока D[n] данных для воспроизведения зависимого вида к (n+1)-му блоку B[n] данных для воспроизведения базового вида. Как показано на фиг. 88A и 88B, в течение периода PJ0[n] перехода через нуль секторов сохраненный объем DA1 данных в RB1 4221 продолжает снижаться на скорости REXT1 передачи для воспроизведения базового вида[n-1], при этом сохраненный объем DA2 данных в RB2 4222 снижается на скорости REXT2[n] передачи для воспроизведения зависимого вида.
Как дополнительно показано на фиг. 88A и 88B, в течение периода PRB[n] считывания n-го блока B[n] данных для воспроизведения базового вида, сохраненный объем DA1 данных в RB1 4221 увеличивается на скорости, равной RUD72-REXT1[n], разности между скоростью RUD72 считывания и скоростью REXT1[n] передачи для воспроизведения базового вида. С другой стороны, сохраненный объем DA2 данных в RB2 4222 продолжает уменьшаться на скорости REXT1[n] передачи для воспроизведения зависимого вида. Как дополнительно показано на фиг. 88C, переход J0[2n+1] через нуль секторов осуществляется от блока B[n] данных для воспроизведения базового вида к следующему блоку D(n+1) данных для воспроизведения зависимого вида. Как показано на фиг. 88A и 88B, в течение периода PJ0[2n+1] перехода через нуль секторов, сохраненный объем DA1 данных в RB1 4221 уменьшается на скорости REXT1[n] передачи для воспроизведения базового вида, а сохраненный объем DA2 данных в RB2 4222 продолжает уменьшаться на скорости REXT2[n] передачи для воспроизведения зависимого вида.
Чтобы воспроизводить трехмерные видеоизображения плавно из одного блока 8810 экстентов, следующие условия [3] и [4] должны удовлетворяться.
[3] Размер SEXT1[n] (n+1)-го блока B[n] данных для воспроизведения базового вида, по меньшей мере, равен объему данных, передаваемому из RB1 4221 в декодер 4225 системных целевых объектов от соответствующего периода PRB[n] считывания до момента непосредственно перед периодом PRB[n+1] считывания следующего блока B[n+1] данных для воспроизведения базового вида. В этом случае, как показано на фиг. 88A, непосредственно перед периодом PRB[n+1] считывания следующего блока B[n+1] данных для воспроизведения базового вида, сохраненный объем DA1 данных в RB1 4221 не опускается ниже объема непосредственно перед периодом PRB[n] считывания n-го блока B[n] данных для воспроизведения базового вида. Длина периода PRB[n] считывания n-го блока B[n] данных для воспроизведения базового вида равна SEXT1[n]/RUD72, значению, полученному посредством деления размера SEXT1[n] этого блока B[n] данных для воспроизведения базового вида на скорость RUD72 считывания. С другой стороны, длина периода PRR[n+1] считывания (n+2)-го блока D[n+1] данных для воспроизведения зависимого вида равна SEXT2[n+1]/RUD72, значению, полученному посредством деления размера SEXT2[n+1] этого блока D[n+1] данных для воспроизведения зависимого вида на скорость RUD72 считывания. Соответственно, размер SEXT1[n] этого блока B[n] данных для воспроизведения базового вида должен быть равным или превышающим минимальным размер экстента, выражаемый в правой стороне выражения 2.
(2)
[4] Размер SEXT2[n] (n+1)-го блока D[n] данных для воспроизведения зависимого вида, по меньшей мере, равен объему данных, передаваемому из RB2 4222 в декодер 4225 системных целевых объектов от соответствующего периода PRR[n] считывания до момента непосредственно перед периодом PRD[n+1] считывания следующего блока D[n+1] данных для воспроизведения зависимого вида, в этом случае, как показано на фиг. 88B, непосредственно перед периодом PRD[n+1] считывания следующего блока D[n+1] данных для воспроизведения зависимого вида, сохраненный объем DA2 данных в RB2 4222 не опускается ниже объема непосредственно перед периодом PRD[n] считывания n-го блока D[n] данных для воспроизведения зависимого вида, длина периода PRD[n] считывания (n+1)-го блока D[n] данных для воспроизведения зависимого вида равна SEXT2[n]/RUD72, значению, полученному посредством деления размера SEXT2[n] этого блока D[n] данных для воспроизведения зависимого вида на скорость RUD72 считывания. Соответственно, размер SEXT2[n] этого блока D[n] данных для воспроизведения зависимого вида должен быть равным или превышающим минимальным размер экстента, выражаемый в правой стороне выражения 3.
(3)
[Плавное соединение между блоками экстентов]
Фиг. 89B является принципиальной схемой, показывающей (M+1)-й (буква M представляет целое число, превышающее или равное 1), блок 8901 экстентов и (M+2)-й блок 8902 экстентов и соответствие между этими блоками 8901 и 8902 экстентов и путем 8920 воспроизведения в режиме трехмерного воспроизведения. Как показано на фиг. 89B, два блока 8901 и 8902 экстентов разделяются посредством межслойной границы LB или области записи для других данных. В соответствии с путем 8920 воспроизведения, весь M-й блок 8901 экстентов сначала считывается за один раз как (M+1)-й экстент SS EXTSS[M]. Переход J[M] осуществляется непосредственно после этого. Затем, (M+2)-й блок 8902 экстентов считывается за один раз как (M+1)-й экстент SS EXTSS[M+1].
Фиг. 89A является графиком, показывающим изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, а также изменения суммы DA1+DA2, когда трехмерные видеоизображения непрерывно воспроизводятся плавно из двух блоков 8901 и 8902 экстентов. На фиг. 89A, линия с чередующимися длинным и коротким пунктиром указывает изменения объема DA1 данных, сохраненного в RB1 4221, пунктирная линия указывает изменения объема DA2 данных, сохраненного в RB2 4222, а сплошная линия указывает изменения суммы DA1+DA2 этих двух объемов данных. На этом графике сплошная линия является аппроксимацией, которая усредняет небольшие изменения каждый раз, когда блок данных считывается. Кроме того, время TJUMP0 перехода через нуль секторов рассматривается как "нуль секунд".
Как показано на фиг. 89A, в течение периода PRBLK[M], во время которого весь (M+1)-й блок 8901 экстентов считывается из BD-ROM-диска 101 в RB1 4221 и RB2 4222, объемы DA1 и DA2 данных, соответственно, сохраненные в RB1 4221 и RB2 4222, увеличиваются. В частности, в течение периода PRBLK[M], во время которого весь (M+1)-й блок 8901 экстентов считывается, сумма DA1+DA2 сохраненных объемов данных увеличивается на скорости, равной разности RUD72-REXTSS[M] между скоростью RUD72 считывания и средней скоростью REXTSS[M] передачи. Эта средняя скорость REXTSS[M] передачи оценивается как значение, полученное посредством деления размера всего M-го блока 8701 экстентов, т.е. размера SEXTSS[M] (M+1)-го экстента SS EXTSS[M], на ATC-время TEXTSS экстента.
В момент, когда последний блок данных для воспроизведения базового вида в (M+1)-м блоке 8901 экстентов считывается в RB1 4221, сумма DA1+DA2 сохраненного объема данных достигает своего максимального значения. В течение периода PJ[M] непосредственно последующего перехода J[M], сумма DA1+DA2 сохраненного объема данных уменьшается на средней скорости REXTSS[M] передачи. Соответственно, посредством регулирования максимального значения суммы DA1+DA2 сохраненного объема данных так, чтобы быть достаточно большим, опустошение в RB1 4221 и RB2 4222 во время перехода J[M] может предотвращаться. Как результат, два блока 8901 и 8902 экстентов могут плавно соединяться.
Максимальное значение суммы DA1+DA2 сохраненного объема данных определяется посредством размера (M+1)-го блока 8701 экстентов. Соответственно, чтобы плавно соединять (M+1)-й блок 8901 экстентов с (M+2)-рым блоком 8902 экстентов, размер (M+1)-го блока 8901 экстентов, т.е. размер SEXTSS[M] (M+1)-го экстента SS EXTSS[M], должен удовлетворять условию 5.
[5] В течение периода PRD[m] считывания блока D данных для воспроизведения зависимого вида, расположенного в начале (M+1)-го блока 8901 экстентов, предварительная загрузка выполняется (буква m представляет целое число, превышающее или равное 1). В течение этого периода PRD[m] предварительной загрузки блок B данных для воспроизведения базового вида, соответствующий блоку D данных для воспроизведения зависимого вида, не сохранен в RB1 4221, и тем самым блок D данных для воспроизведения зависимого вида не может быть передан из RB2 4222 в декодер 4225 системных целевых объектов. Соответственно, данные в M-том блоке экстентов передаются из RB2 4222 в декодер 4225 системных целевых объектов в течение периода PRD[m] предварительной загрузки. Это поддерживает предоставление данных в декодер 4225 системных целевых объектов. Аналогично, в течение периода PRD[n] считывания блока D данных для воспроизведения зависимого вида, расположенного в начале (M+2)-го блока 8902 экстентов, предварительная загрузка выполняется (буква n представляет целое число, превышающее или равное m+1). Соответственно, в течение периода PRD[n] предварительной загрузки, длящегося от периода непосредственно предшествующего перехода J[M], данные в (M+1)-м блоке 8901 экстентов передаются из RB2 4222 в декодер 4225 системных целевых объектов. Это поддерживает предоставление данных в декодер 4225 системных целевых объектов. Следовательно, чтобы предотвращать опустошение как в RB1 4221, так и в RB2 4222 во время перехода J[M], ATC-время TEXTSS экстента для (M+1)-го экстента SS EXTSS[M] должно быть, по меньшей мере, равным длине периода от конечного времени T0 периода PRD[m] предварительной загрузки в (M+1)-м блоке 8901 экстентов до конечного времени T1 периода PRD[n] предварительной загрузки в (M+2)-ром блоке 8902 экстентов. Другими словами, размер SEXTSS[M] (M+1)-го экстента SS EXTSS[M] должен, по меньшей мере, быть равным сумме объемов данных, передаваемых из RB1 4221 и RB2 4222 в декодер 4225 системных целевых объектов в течение периода T0-T1.
Как очевидно из фиг. 89A, длина T0-T1 периода равна сумме длины периода PRBLK[M] считывания (M+1)-го блока 8901 экстентов, времени TJUMP[M] перехода для перехода J[M] и разности TDIFF[M] в длинах периодов PRD[n] и PRD[m] предварительной загрузки в блоках 8901 и 8002 экстентов. Кроме того, длина периода PRBLK[M] считывания (M+1)-го блока 8901 экстентов равна SEXTSS[M]/RUD72, значению, полученному посредством деления размера SEXTSS[M] (M+1)-го экстента SS EXTSS[M] на скорость RUD72 считывания. Соответственно, размер SEXTSS[M] (M+1)-го экстента SS EXTSS[M] должен быть равным или превышающим минимальным размер экстента, выражаемый в правой стороне выражения 4.
(4)
Длины периодов PRD[m] и PRD[n] предварительной загрузки, соответственно, равны SEXT2[m]/RUD72 и SEXT2[n]/RUD72, значениям, полученным посредством деления размеров SEXT2[m] и SEXT2[n] блока D данных для воспроизведения зависимого вида, расположенного в начале блоков 8901 и 8902 экстентов, на скорость RUD72 считывания. Соответственно, разность TDIFF в длинах периодов PRD[m] и PRD[n] предварительной загрузки равна разности в этих значениях: TDIFF=SEXT2[n]/RUD72-SEXT2[m]/RUD72. Следует отметить, что аналогично правой стороне выражений 1-3, правая сторона выражения 4 может выражаться как целочисленное значение в единицах байтов.
Кроме того, когда декодирование мультиплексированных потоковых данных улучшается следующим образом, разность TDIFF в правой стороне выражения 4 может рассматриваться как нуль. Во-первых, находится максимальное значение разности TDIFF для всех мультиплексированных потоковых данных, т.е. самое плохое значение TDIFF. Затем, когда мультиплексированные потоковые данные воспроизводятся, начало декодирования задерживается после начала считывания на время, равное самому плохому значению TDIFF.
<<Условия для уменьшения емкостей буферов считывания>>
Фиг. 90A и 90B являются графиками, показывающими изменения объемов DA1 и DA2 данных, сохраненных в RB1 4221 и RB2 4222, когда трехмерные видеоизображения воспроизводятся плавно из двух последовательных блоков 8901 и 8902 экстентов, показанных на фиг. 89B. Как показано на фиг. 90A, сохраненный объем DA1 данных в RB1 4221 достигает максимального значения DM1 в момент, когда блок B[n-1] данных для воспроизведения базового вида в конце (M+1)-го блока 8901 экстентов считывается в RB1 4221. Кроме того, сохраненный объем DA1 данных снижается на скорости REXT1[n-1] передачи для воспроизведения базового вида с периода PJ[M] непосредственно последующего перехода J[M] через период PRD[n] предварительной загрузки в (M+2)-ром блоке 8902 экстентов. Соответственно, чтобы не допускать достижения нуля посредством сохраненного объема DA1 до завершения периода PRD[n] предварительной загрузки, максимальное значение DM1 сохраненного объема DA1 данных должно быть равным или превышающим объем данных, передаваемый из RB1 4221 в декодер 4225 системных целевых объектов в течение периода PJ[M] перехода и периода PRD[n] предварительной загрузки. Другими словами, максимальное значение DM1 сохраненного объема DA1 данных должно быть превышающим или равным сумме длины TJUMP[M] периода PJ[M] перехода и длины периода PRD[n] предварительной загрузки, SEXT2[n]/RUD72, умноженной на скорость REXT1[n-1] передачи для воспроизведения базового вида: DM1≥(TJUMP[M]+SEXT2[n]/RUD72)xREXT1[n-1]. Когда длина TJUMP[M] периода PJ[M] перехода равна максимальному времени TJUMP_MAX перехода для перехода J[M], а скорость REXT1[n-1] передачи для воспроизведения базового вида равна своему максимальному значению RMAX1, максимальное значение DM1 сохраненного объема DA1 данных имеет наибольшее значение. Соответственно, RB1 4221 должен иметь емкость RB1, равную или превышающую максимальное значение DM1 в этом случае: RB1≥(TJUMP_MAX+SEXT2[n]/RUD72)xRMAX1.
С другой стороны, как показано на фиг. 90B, в момент, когда считывание блока B[n-1] данных для воспроизведения базового вида конца в (M+1)-м блоке 8901 экстентов начинается, сохраненный объем DA2 данных в RB2 4222 достигает своего максимального значения DM2. Кроме того, сохраненный объем DA2 данных снижается на скорости REXT2[n-1] передачи для воспроизведения зависимого вида от периода считывания блока B[n-1] данных для воспроизведения базового вида через период PRD[n] предварительной загрузки в (M+2)-ром блоке 8902 экстентов. Соответственно, чтобы поддерживать предоставление данных в декодер 4225 системных целевых объектов через конец периода PRD[n] предварительной загрузки, максимальное значение DM2 сохраненного объема DA2 данных должно быть равным или превышающим объем данных, передаваемый из RB2 4222 в декодер 4225 системных целевых объектов в течение периода считывания блока B[n-1] данных для воспроизведения базового вида, периода PJ[M] перехода и периода PRD[n] предварительной загрузки. Другими словами, максимальное значение DM2 сохраненного объема DA2 данных должно быть превышающим или равным сумме длины периода считывания блока B[n-1] данных для воспроизведения базового вида SEXT1[n-1]/RUD72, длины TJUMP[M] периода PJ[M] перехода и длины периода PRD[n] предварительной загрузки, SEXT2[n]/RUD72, умноженной на скорость REXT2[n-1] передачи для воспроизведения зависимого вида: DM2≥(SEXT2[n-1]/RUD72+TJUMP[M]+SEXT2[n]/RUD72)×REXT1[n-1]. Когда длина TJUMP[M] периода PJ[M] перехода равна максимальному времени TJUMP_MAX перехода для перехода J[M], а скорость REXT2[n-1] передачи для воспроизведения зависимого вида равна своему максимальному значению RMAX2, максимальное значение DM2 сохраненного объема DA2 данных имеет наибольшее значение. Соответственно, RB2 4222 должен иметь емкость RB2, равную или превышающую максимальное значение DM2 в этом случае: RB2≥(SEXT1[n-1]/RUD72+TJUMP_MAX+SEXT2[n]/RUD72)×RMAX2. Кроме того, поскольку любой блок данных для воспроизведения зависимого вида может быть первым блоком данных, считываемым в ходе воспроизведения с прерываниями, емкость RB2 для RB2 4222 должна быть не меньше размера любого из блоков данных для воспроизведения зависимого вида: RB2≥SEXT2[k] (буква k представляет случайное целое число).
Согласно вышеприведенному описанию, нижние пределы емкости RB1 и RB2 RB1 4221 и RB2 4222 определяются посредством размеров SEXT1[k] и SEXT2[k] блоков данных. Соответственно, чтобы экономить емкость RB1 и RB2, верхний предел размеров SEXT1[k] и SEXT2[k] блоков данных, т.е. максимальный размер экстента, ограничен через следующее условие [6].
[6] Как показано на фиг. 19, блоки B[k] данных для воспроизведения базового вида в каждом блоке 1901-1903 экстентов совместно используются посредством файла 2D и файла SS. Соответственно, размер SEXT1[k] блоков B[k] данных для воспроизведения базового вида должен удовлетворять выражению 1. С другой стороны, чтобы уменьшать емкость RB1 RB1 4221 в максимально возможной степени, размер SEXT1[k] блоков B[k] данных для воспроизведения базового вида должен быть равным или меньшим нижнего предела минимального размера экстента для двумерных экстентов. Другими словами, размер SEXT1[k] должен быть равным или меньшим максимального размера экстента, выражаемого в правой стороне выражения 5.
(5)
Следует отметить, что нижний предел минимального размера экстента для двумерных экстентов оценивается посредством выражения 1, в котором средняя скорость REXT2D передачи, включенная в знаменатель правой стороны выражения 1, заменена на максимальное значение RMAX. В этом выражении, время TJUMP-2D_MIN перехода - это минимальное значение времени перехода, необходимого в каждом блоке 1901-1903 экстентов, т.е. минимальное значение максимального времени TJUMP_MAX перехода между двумерными экстентами. В частности, время TJUMP-2D_MIN перехода задается равным минимальному значению 250 мс, указываемому в таблице на фиг. 86. Между тем, расстояние между двумерными экстентами равно размеру SEXT2[k] блока D[k] данных для воспроизведения зависимого вида. Соответственно, когда время перехода TJUMP-2D_MIN задается равным 250 мс, размер SEXT2[k] блока D[k] данных для воспроизведения зависимого вида ограничен максимальным расстоянием SJUMP_MAX перехода=10000 секторов или менее согласно максимальному времени TJUMP_MAX перехода=250 мс в таблице на фиг. 86. Другими словами, максимальный размер экстента блоков данных для воспроизведения зависимого вида составляет 10000 секторов.
Заключение
Чтобы плавно воспроизводить как двумерные, так и трехмерные видеоизображения из множества блоков экстентов, всех из вышеуказанных условий [1]-[6] должны удовлетворяться. В частности, размеры блоков данных и блоков экстентов должны удовлетворять следующим условиям 1-5.
Условие 1: Размер SEXT2D двумерного экстента должен удовлетворять выражению 1.
Условие 2: Размер SEXT1 блока данных для воспроизведения базового вида должен удовлетворять выражению 2.
Условие 3: Размер SEXT2 блок данных для воспроизведения зависимого вида должен удовлетворять выражению 3.
Условие 4: Размер SEXTSS блока экстентов должен удовлетворять выражению 4.
Условие 5: Размер SEXT1 блока данных для воспроизведения базового вида должен удовлетворять выражению 5.
<<Модификации в условие 1>>
Как очевидно из пути 2101 воспроизведения в режиме двумерного воспроизведения, показанном на фиг. 21, переходы часто осуществляются в режиме двумерного воспроизведения. Соответственно, чтобы дополнительно обеспечивать плавное воспроизведение, предпочтительно дополнительно добавлять допустимый запас (допуск) к минимальному размеру экстента для двумерных экстентов, представленных посредством правой стороны выражения 1. Тем не менее, добавление этого допустимого запаса не должно изменять выражение 5. Это обусловлено тем, что это может приводить к увеличению емкости буфера считывания. Далее приведены три способа для добавления такого допустимого запаса без изменения выражения 5.
Первый способ добавляет допустимый запас к минимальному размеру экстента для двумерного экстента посредством замены средней скорости REXT2D передачи, включенной в знаменатель правой стороны выражения 1, на максимальное значение RMAX. Другими словами, условие 1 изменяется так, что размер SEXT2D двумерного экстента удовлетворяет выражению 6 вместо выражения 1.
(6)
Следует отметить, что, в выражении 5 используется выражение, которое получается посредством замены средней скорости REXT2D передачи, включенной в знаменатель правой стороны выражения 1, на максимальное значение REXT2D. Соответственно, даже если выражение 1 изменяется на выражение 6, выражение 5 не изменяется.
Второй способ добавляет допустимый запас к минимальному размеру экстента для двумерного экстента посредством продления ATC-времени экстента для двумерного экстента на ΔT секунд. Другими словами, условие 1 изменяется так, что размер SEXT2D двумерного экстента удовлетворяет выражению 7A или 7B вместо выражения 1.
(7A)
(7B)
Расширенное время ΔT может быть определено посредством длины GOP или посредством верхнего предела числа экстентов, которые могут воспроизводиться в течение предварительно определенного времени. Например, если длина GOP составляет одну секунду, ΔT задается равным 1,0 секунды. С другой стороны, если верхний предел числа экстентов, которые могут воспроизводиться в течение предварительно определенного времени в секундах, составляет n, то ΔT задается равным предварительно определенному времени/n.
Третий способ добавляет допустимый запас к минимальному размеру экстента для двумерного экстента посредством замены средней скорости REXT2D передачи, включенной в правую сторону выражения 1, на максимальное значение RMAX2D. Другими словами, условие 1 изменяется так, что размер SEXT2D двумерного экстента удовлетворяет выражению 8 вместо выражения 1.
(8)
В этом способе еще больший допустимый запас может добавляться к минимальному размеру экстента. В отличие от этого, тем не менее, даже когда скорость передачи битов двумерного экстента является низкой, размер должен поддерживаться достаточно большим. Соответственно, необходимо сравнивать размер допустимого запаса с эффективностью записи данных на BD-ROM-диске.
Следует отметить, что, когда второй способ приспосабливается и если большая достоверность плавного воспроизведения двумерных видеоизображений может приоритезироваться выше уменьшения емкости буфера считывания, выражение 5 может изменяться на выражение 9.
(9)
<Скорость передачи потоковых данных>
Фиг. 91 является блок-схемой, показывающей систему обработки видеопотоков, предоставленную в декодере 4225 системных целевых объектов в режиме трехмерного воспроизведения. Как показано на фиг. 91, система обработки включает в себя пару модулей 4511 и 4512 депакетирования источников, пару PID-фильтров 4513 и 4514 и декодер 4515 первичного видео, которые показаны на фиг. 45.
Первый модуль 4511 депакетирования источников считывает исходные пакеты из каждого блока данных для воспроизведения базового вида в RB1 4221 на скорости REXT1 передачи для воспроизведения базового вида. Первый модуль 4511 депакетирования источников дополнительно извлекает TS-пакеты из исходных пакетов и передает TS-пакеты в первый PID-фильтр 4513. Средняя скорость передачи достигает системной скорости RTS1 для файла 2D на максимуме. Таким образом, максимальное значение RMAX1 скорости REXT1 передачи для воспроизведения базового вида равно 192/188, умноженным системную скорость RTS1. Первый PID-фильтр 4513 передает TS-пакеты, включающие в себя видеопоток для воспроизведения базового вида, в TB1 4501 в декодере 4515 первичного видео. TB1 4501 восстанавливает PES-пакеты из TS-пакетов и передает PES-пакеты в MB1 4502 на средней скорости RX1. MB1 4502 извлекает VAU видеопотока для воспроизведения базового вида из PES-пакетов и передает VAU в EB1 4503 на средней скорости RBX1.
Второй модуль 4512 депакетирования источников считывает исходные пакеты из каждого блока данных для воспроизведения зависимого вида в RB2 4222 на скорости REXT2 передачи для воспроизведения зависимого вида. Второй модуль 4512 депакетирования источников дополнительно извлекает TS-пакеты из исходных пакетов и передает TS-пакеты во второй PID-фильтр 4514. Средняя скорость передачи достигает системной скорости RTS2 для файла DEP на максимуме. Таким образом, максимальное значение RMAX2 скорости REXT2 передачи для воспроизведения зависимого вида равно 192/188, умноженным системную скорость RTS2. Второй PID-фильтр 4514 передает TS-пакеты, включающие в себя видеопоток для воспроизведения зависимого вида, в TB2 4508 в декодере 4515 первичного видео. TB2 4508 восстанавливает PES-пакеты из TS-пакетов и передает PES-пакеты в MB2 4509 на средней скорости RX2. MB2 4509 извлекает VAU видеопотока для воспроизведения зависимого вида из PES-пакетов и передает VAU в EB2 4510 на средней скорости RBX2.
VAU, сохраненные в каждом из EB1 4503 и EB2 4510, поочередно передаются в EC 4504 посредством переключателя 4506 буферов и декодируются в данные несжатых изображений DEC 4504. Здесь, как показано на фиг. 7, изображения для воспроизведения зависимого вида сжимаются в отношении изображений для воспроизведения базового вида. Соответственно, средняя скорость передачи битов изображений для воспроизведения зависимого вида ниже средней скорости передачи битов изображений для воспроизведения базового вида. Таким образом, системная скорость RTS2 для файла DEP может задаваться так, чтобы быть меньше системной скорости RTS1 для файла 2D. Например, когда системная скорость RTS1 для файла 2D задается так, чтобы быть равной или меньшей 45 Мбит/с, системная скорость RTS2 для файла DEP может задаваться так, чтобы быть равной или меньшей 30 Мбит/с: RTS1≤45 Мбит/с, RTS2≤≤30 Мбит/с.
Здесь, предполагается, что сумма системных скоростей RTS1 и RTS2 ограничена тем, чтобы быть равной или меньшей предварительно определенного порогового значения. Предварительно определенное пороговое значение задается так, чтобы быть равным или меньшим ширины полосы передачи, назначенной декодеру 4225 системных целевых объектов, например, равным 60 Мбит/с: RTS1+RTS2≤60 Мбит/с. В этом случае, когда системная скорость RTS1 для файла 2D задается равной 45 Мбит/с, системная скорость RTS2 для файла DEP ограничена тем, чтобы быть равной или меньшей 15 Мбит/с: RTS1=45 Мбит/с, RTS2≤15 Мбит/с. До тех пор, пока скорость передачи битов каждого видеопотока поддерживается при среднем значении, ограничение на сумму системных скоростей RTS1 и RTS2 является преимущественным для эффективного использования полосы передачи. В действительности, тем не менее, предусмотрены случаи, когда скорость передачи битов видеопотока для воспроизведения зависимого вида временно превышает скорость передачи битов видеопотока для воспроизведения базового вида. Например, в трехмерных видеоизображениях, представляющих естественные сцены, такая инверсия скоростей передачи битов может возникать, когда базовый вид (т.е. вид для просмотра левым глазом) резко становится расфокусированным, и только зависимый вид (т.е. вид для просмотра правым глазом) является сфокусированным. В этом случае, хотя скорость REXT1 передачи для воспроизведения базового вида гораздо ниже системной скорости RTS1=45 Мбит/с, скорость REXT2 передачи для воспроизведения зависимого вида не может превышать системную скорость RTS2≤15 Мбит/с (точно, 192/188~1,02 раз. В дальнейшем в этом документе, коэффициент рассматривается как "1", если не указано иное). Из этого следует понимать, что, когда сумма системных скоростей RTS1 и RTS2 ограничена, скорость REXT2 передачи для воспроизведения зависимого вида не может реагировать на временное увеличение скорости передачи битов видеопотока для воспроизведения зависимого вида.
Такой ответ на временное увеличение может быть реализован посредством ограничения, вместо суммы системных скоростей RTS1 и RTS2, суммы скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида в единицах экстентов: REXT1[n]+REXT1[n]≤60 Мбит/с. Скорость REXT1[n] передачи для воспроизведения базового вида является средним значением скоростей передачи, на которых передаются исходные пакеты, включающие в себя (n+1)-й экстент EXT1[n] в файле base, а скорость REXT2[n] передачи для воспроизведения зависимого вида является средним значением скоростей передачи, на которых передаются исходные пакеты, включающие в себя (n+1)-й экстент EXT2[n] в файле base. Фиг. 92A и 92B являются графиками, показывающими временные изменения скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида в этом случае, соответственно. Как показано на фиг. 92A, скорость REXT1 передачи для воспроизведения базового вида падает с максимального значения RMAX1~45 Мбит/с в первое время T0 и остается на низком уровне=15 Мбит/с в течение периода TSTR от первого времени T0 до второго времени T1. Как указано посредством графика GR1 со сплошными линиями на фиг. 92B, скорость REXT2 передачи для воспроизведения зависимого вида может изменяться в ответ на изменение скорости REXT1 передачи для воспроизведения базового вида способом, аналогичным взаимному выполнению. В частности, в вышеуказанный период TSTR, пик P1 может достигать максимального значения RMAX2 ~ 30 Мбит/с. Таким образом, когда сумма скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида ограничена в единицах экстентов, скорость REXT2 передачи для воспроизведения зависимого вида может реагировать на временное увеличение скорости передачи битов видеопотока для воспроизведения зависимого вида.
Чтобы использовать полосу передачи, назначенную декодеру 4225 системных целевых объектов, более эффективно при передаче потоковых данных, предпочтительно задавать системную скорость RTS2 для файла DEP равной дополнительно более высокому значению. Фиг. 92C является графиком, показывающим временное изменение суммы скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида, показанных на фиг. 92A и 92B. Как указано посредством кривой CV на графике GR3 со сплошными линиями, показанном на фиг. 92C, сумма скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида ниже порогового значения 60 Мбит/с в течение периода TSTR от первого времени T0 до второго времени T1. Это обусловлено тем, что скорость REXT2 передачи для воспроизведения зависимого вида ограничена тем, чтобы быть равной или меньшей системной скорости RTS2 (=30 Мбит/с) для файла DEP, как указано посредством графика GR1 со сплошными линиями на фиг. 92B. Как показано на фиг. 92A, поскольку скорость REXT1 передачи для воспроизведения базового вида падает до 15 Мбит/с в период TSTR, полоса передачи имеет, по меньшей мере, допуск, равный разности между значением и пороговым значением 60-15=45 Мбит/с. Таким образом, системная скорость RTS2 для файла DEP задается в диапазоне выше 30 Мбит/с, предпочтительно в диапазоне, идентичном диапазону системной скорости RTS1 для файла 2D, например, равной или меньшей 45 Мбит/с: RTS1≤45 Мбит/с, RTS2≤≤45 Мбит/с. Графики GR2 и GR4 с пунктирными линиями на фиг. 92B и 92C показывают скорость REXT2 передачи для воспроизведения зависимого вида и сумму скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида в этом случае, соответственно. Как указано посредством графика GR2 с пунктирными линиями на фиг. 92B, пик P2 скорости REXT2 передачи для воспроизведения зависимого вида может превышать 30 Мбит/с. Как результат, как указано посредством графика GR4 с пунктирными линиями на фиг. 92C, сумма скорости REXT1 передачи для воспроизведения базового вида и скорости REXT2 передачи для воспроизведения зависимого вида поддерживается рядом с пороговым значением в 60 Мбит/с в течение периода TSTR. Таким образом, эффективность использования полосы передачи дополнительно может повышаться.
Здесь следует отметить, что, когда системная скорость RTS2 для файла DEP задается равной значению, которое не меньше системной скорости RTS1 для файла 2D, их сумма RTS1+RTS2, в общем, превышает ширину полосы передачи декодера 4225 системных целевых объектов. С другой стороны, поскольку скорость REXT1[n] передачи для воспроизведения базового вида и скорость REXT1[n] передачи для воспроизведения зависимого вида являются средними значениями, даже если пороговое значение суммы этих средних значений предоставляется, сумма мгновенных значений скоростей передачи может превышать пороговое значение без ограничения. Здесь, в качестве конкретного примера предполагается, что каждая из системных скоростей RTS1 и RTS2 задается равной 45 Мбит/с, ATC-время экстента для каждого экстента составляет три секунды, и сумма скоростей передачи поддерживается равной 30 Мбит/с в первой части (1,5 секунды) ATC-времени экстента. В этом случае, даже если каждая скорость передачи увеличивается до 45 Мбит/с во второй части (1,5 секунды) ATC-времени экстента, сумма средних значений скоростей передачи во всем экстенте сохраняется равной 60 Мбит/с. Соответственно, даже если сумма скорости REXT1[n] передачи для воспроизведения базового вида и скорости REXT2[n] передачи для воспроизведения зависимого вида ограничена тем, чтобы быть равной или меньшей 60 Мбит/с, увеличение суммы мгновенных значений скоростей передачи до 90 Мбит/с не может быть исключено. Таким образом, посредством простого ограничения суммы скорости REXT1[n] передачи для воспроизведения базового вида и скорости REXT2[n] передачи для воспроизведения зависимого вида риск того, что полоса передачи декодера 4225 системных целевых объектов насыщается, не может удаляться полностью.
Чтобы дополнительно уменьшать риск того, что полоса передачи декодера 4225 системных целевых объектов насыщается, ограничение на сумму скоростей передачи может модифицироваться следующим образом. Фиг. 93 является принципиальной схемой, показывающей взаимосвязи между TS-пакетами, которые передаются в декодере системных целевых объектов из модуля депакетирования источников в PID-фильтр, и ATC-временами. Как показано на фиг. 93, прямоугольники 9310 в верхней строке представляют периоды передачи TS-пакетов TS1 #p (p=0, 1, 2, 3..., k, k+1, k+2), составляющих экстент для воспроизведения базового вида, а прямоугольники 9320 в нижней строке представляют периоды передачи TS-пакетов TS2 #q (q=0, 1, 2, 3..., m-1, m, m+1), составляющих экстент для воспроизведения зависимого вида. Эти прямоугольники 9310, 9320 размещаются в порядке передачи TS-пакетов вдоль временной оси ATC. Позиция начала каждого прямоугольника 9310 и 9320 представляет начальное время передачи TS-пакета. Длины AT1 и AT2 каждого прямоугольника 9310 и 9320 представляют количество времени, необходимое для передачи одного TS-пакета из буфера считывания в декодер системных целевых объектов. Каждый раз, когда оно начинает передавать один TS-пакет из модуля депакетирования источников, устройство трехмерного воспроизведения задает одно окно (WIN1, WIN2 и WIN3 на фиг. 93), имеющее предварительно определенную продолжительность (например, одна секунда) с началом в начальном времени передачи. Устройство трехмерного воспроизведения дополнительно усредняет каждую скорость передачи TS1 и TS2 в каждом из окон WIN1, WIN2 и WIN3 и ограничивает сумму средних значений предварительно определенным пороговым значением или ниже. В примере, показанном на фиг. 93, сначала первое окно WIN1, начальная точка которого является начальным временем передачи A1 TS1 #0, задается, и относительно #0-k TS1 и #0-m TS2, которые передаются в окне, сумма скоростей передачи ограничена тем, чтобы быть равной или меньшей порогового значения. Аналогично, относительно TS1 #0-(k+1) и #0-m TS2, которые передаются во втором окне WIN2, начальная точка которого является начальным временем передачи A2 TS2 #0, сумма скоростей передачи ограничена тем, чтобы быть равной или меньшей порогового значения, и относительно TS1 #1-(k+1) и TS2 #0-(m+1), которые передаются в третьем окне WIN3, начальная точка которого является начальным временем передачи A3 TS1 #1, сумма скоростей передачи ограничена тем, чтобы быть равной или меньшей порогового значения. Таким образом, сумма средних скоростей передачи в каждом окне ограничена тем, чтобы быть равной или меньшей предварительно определенного порогового значения посредством сдвига из одного окна к другому, каждое из которых имеет предварительно определенную длину, на время передачи в расчете на TS-пакет. При такой структуре, по мере того, как окно становится более коротким, риск того, что полоса передачи декодера 4225 системных целевых объектов насыщается, становится ниже.
Когда системная скорость RTS2 для файла DEP задается так, чтобы быть не меньше системной скорости RTS1 для файла base, скорость REXT2 передачи для воспроизведения зависимого вида может увеличиваться до аналогичного уровня. Когда скорость REXT2[n] передачи для воспроизведения зависимого вида для (n+1)-го экстента для воспроизведения зависимого вида увеличивается таким образом, скорость REXT1[n] передачи для воспроизведения базового вида для (n+1)-го экстента для воспроизведения базового вида падает до значения, которое гораздо ниже максимального значения RMAX1. С другой стороны, в выражении 5, которое задает максимальный размер экстента, средняя скорость передачи, REXT7D, включенная в знаменатель, оценивается как максимальное значение RMAX2D. Кроме того, верхний предел ATC-времени экстента для (n+1)-го экстента для воспроизведения базового вида является значением, которое представляется как отношение максимального размера экстента к скорости REXT1[n] передачи для воспроизведения базового вида. Соответственно, верхнее предельное значение гораздо больше фактического ATC-времени экстента. Поскольку (n+1)-й экстент для воспроизведения базового вида и (n+1)-й экстент для воспроизведения зависимого вида имеют одинаковое ATC-время экстента, размер экстента для воспроизведения зависимого вида на максимуме равен произведению скорости REXT2[n] передачи для воспроизведения зависимого вида и верхнего предельного значения ATC-времени экстента. Поскольку размер намного превышает значение, которое фактически необходимо для плавного воспроизведения, емкость RB2 не может дополнительно уменьшаться. Соответственно, когда системная скорость RTS2 для файла DEP задается так, чтобы быть не меньше системной скорости RTS1 для файла base, предпочтительно условие 5 для максимального размера экстента, а именно, выражение 5, заменяется на выражение 10.
(10)
В правой стороне выражения 10 максимальное значение RMAX2D средней скорости передачи для двумерного экстента или разности между суммой максимальных значений RMAX1+RMAX2 скорости передачи и скоростью REXT2 передачи для воспроизведения зависимого вида, какая из них меньше, приспосабливается в качестве скорости передачи, которая должна быть включена в знаменатель. Здесь, сумма максимальных значений RMAX1+RMAX2 скорости передачи равна 192/188, умноженным на сумму системных скоростей RTS1+RTS2. Соответственно, когда скорость REXT2 передачи для воспроизведения зависимого вида увеличивается до аналогичного уровня до системной скорости, максимальный размер экстента оценивается как вышеописанная разность. При такой структуре, верхний предел ATC-времени экстента для экстента для воспроизведения базового вида ограничен значением, которое ближе к фактическому ATC-времени экстента. По этой причине, размер экстента для воспроизведения зависимого вида ограничен значением, которое фактически необходимо для плавного воспроизведения. Таким образом, можно поддерживать емкость RB2 достаточно небольшой.
<Компоновка блоков данных, когда системная скорость для файла DEP является высокой>
Фиг. 94A является таблицей, показывающей, относительно одной пары экстентов, максимальные размеры maxSEXT1[n] и maxSEXT2[n] экстентов для каждой комбинации скорости REXT1[n] передачи для воспроизведения базового вида и скорости REXT2[n] передачи для воспроизведения зависимого вида. Здесь, "пара экстентов" означает пару из (n+1)-го экстента для воспроизведения базового вида, включенного в файл base, и (n+1)-го экстента для воспроизведения зависимого вида, включенного в файл DEP (n=0, 1, 2, ...). Максимальные размеры maxSEXT1[n] и maxSEXT2[n] экстентов являются значениями, которые вычисляются посредством использования выражения 5.
Как очевидно из того факта, что выражение 5 включает в себя скорость RUD54 считывания BD-ROM-накопителя в режиме двумерного воспроизведения, максимальные размеры maxSEXT1[n] и maxSEXT2[n] экстентов зависят от производительности BD-ROM-накопителя. Соответственно, значения, показанные на фиг. 94A, являются только одним примером.
Как показано на фиг. 94A, когда скорость REXT1[n] передачи для воспроизведения базового вида составляет 45 Мбит/с, а скорость REXT2[n] передачи для воспроизведения зависимого вида составляет 15 Мбит/с, максимальный размер maxSEXT2[n] экстента для экстента для воспроизведения зависимого вида составляет 6 MB. Наоборот, когда скорость REXT1[n] передачи для воспроизведения базового вида составляет 15 Мбит/с, а скорость REXT2[n] передачи для воспроизведения зависимого вида составляет 45 Мбит/с, максимальный размер maxSEXT2[n] экстента для экстента для воспроизведения зависимого вида составляет 8 MB. Как пояснено со ссылкой на фиг. 90, чем больше размер блока данных для воспроизведения зависимого вида, расположенного в начале каждого блока экстентов, тем большая емкость требуется для буфера считывания. Таким образом, не является предпочтительным для скорости REXT2[n] передачи для воспроизведения зависимого вида то, чтобы увеличиваться в течение периода предварительной загрузки блока экстентов, поскольку это приводит к увеличению максимального размера maxSEXT2[n] экстента для экстента для воспроизведения зависимого вида, предотвращая дополнительное уменьшение емкости буфера считывания.
Таким образом, в паре EXT1[n], EXT2[n] экстентов, расположенных в начале блока экстентов, когда скорость REXT2[n] передачи для воспроизведения зависимого вида превышает скорость REXT1[n] передачи для воспроизведения базового вида, блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида. Другими словами, в паре экстентов, блок данных небольшого объема размещается перед блоком данных большого объема. Это предоставляет возможность сохранения небольшой емкости буфера считывания, как показано ниже.
Фиг. 94B является принципиальной схемой, показывающей случай, когда вышеописанная компоновка приспосабливается для двух блоков 9401 и 9402 экстентов, которые размещаются с межслойной границей LB между ними. Как показано на фиг. 94B, из пар экстентов для файла base 9411 и файла DEP 9412, (n+1)-я пара EXT1[n], EXT2[n] экстентов размещается перед M-тым блоком 9402 экстентов. В паре экстентов скорость REXT2[n] передачи для воспроизведения зависимого вида превышает скорость REXT1[n] передачи для воспроизведения базового вида, и тем самым блок D[n] данных для воспроизведения зависимого вида имеет больший размер, чем блок B[n] данных для воспроизведения базового вида. Соответственно, в паре экстентов, блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида. С другой стороны, в (n-1)-й, n-й и (n+2)-й парах EXT1[k], EXT2[k] экстентов (k=n-2, n-1, n+1), скорость REXT2[k] передачи для воспроизведения зависимого вида ниже скорости REXT1[k] передачи для воспроизведения базового вида, и тем самым блок D[k] данных для воспроизведения зависимого вида имеет меньший размер, чем блок B[k] данных для воспроизведения базового вида. Соответственно, в этих парах экстентов, блок D[k] данных для воспроизведения зависимого вида размещается перед блоком B[k] данных для воспроизведения базового вида.
Фиг. 95A и 95B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 и RB2, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9401 и 9402 экстентов, показанных на фиг. 94B. Графики G1P, G2P, начерченные посредством сплошной линии, показывают изменения сохраненных объемов DA1, DA2 данных, когда блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида в (n+1)-й паре EXT1[n], EXT2[n] экстентов, расположенных в начале M-го блока 9402 экстентов. Графики G1Q, G2Q, начерченные посредством пунктирной линии, показывают изменения сохраненных объемов DA1, DA2 данных, когда блок D[n] данных для воспроизведения зависимого вида размещается перед блоком B[n] данных для воспроизведения базового вида в паре EXT1[n], EXT2[n] экстентов.
Как показано на фиг. 95A, сохраненный объем DA1 данных в RB1 достигает максимального значения DM10, DM11 в момент, когда блок B[n-1] данных для воспроизведения базового вида в конце M-го блока 9401 экстентов считывается в RB1. Кроме того, сохраненный объем DA1 данных снижается на скорости REXT1[n-1] передачи для воспроизведения базового вида от непосредственно последующего периода PJ[M] перехода через период PRB[n], PRD[n] предварительной загрузки в M-том блоке 9402 экстентов. Здесь, в (n+1)-й паре EXT1[n], EXT2[n] экстентов, блок B[n] данных для воспроизведения базового вида имеет меньший размер, чем блок D[n] данных для воспроизведения зависимого вида. Соответственно, длина SEXT1[n]/RUD72 периода PRB[n] предварительной загрузки, когда блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида, меньше длины SEXT2[n]/RUD72 периода PRD[n] предварительной загрузки обратной компоновки. Как результат, максимальное значение DM11 сохраненного объема DA1 данных, когда блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида, ниже максимального значения DM10 обратной компоновки.
Как показано на фиг. 95B, сохраненный объем DA2 данных в RB2 достигает максимального значения DM20, DM21 в момент, когда блок B[n-1] данных для воспроизведения базового вида в конце (M-1)-го блока 9401 экстентов считывается в RB2. Кроме того, сохраненный объем DA2 данных снижается на скорости REXT2[n-1] передачи для воспроизведения зависимого вида от периода считывания блока B[n-1] данных для воспроизведения базового вида через период PRB[n], PRD[n] предварительной загрузки в M-том блоке 9402 экстентов. Здесь, длина SEXT1[n]/RUD72 периода PRB[n] предварительной загрузки, когда блок B[n] данных для воспроизведения базового вида размещается перед блоком D[n] данных для воспроизведения зависимого вида, меньше длины SEXT2[n]/RUD72 периода PRB[n] предварительной загрузки обратной компоновки. Как результат, максимальное значение DM21 сохраненного объема DA2 данных, когда блок D[n] данных для воспроизведения зависимого вида размещается перед блоком B[n] данных для воспроизведения базового вида, ниже максимального значения DM20 обратной компоновки.
Как описано выше, в паре экстентов, размещаемой в начале блока экстентов, можно сохранять емкость буфера считывания небольшой посредством размещения блока данных небольшого объема перед блоком данных большого объема.
Аналогично, в паре экстентов, размещаемой в позиции, в которой воспроизведение с прерываниями может быть запущено, блок данных небольшого объема размещается перед блоком данных большого объема. Это предоставляет возможность сохранения небольшой емкости буфера считывания. В этом случае, порядок блоков данных может быть изменен на противоположный даже в паре экстентов, расположенной в середине блока экстентов, а также в паре экстентов, расположенной в его начале. Фиг. 96A является принципиальной схемой, показывающей синтаксис начальной точки экстента для такой компоновки. Эта начальная точка экстента (Extent_Start_Point), аналогично начальным точкам экстентов, показанным на фиг. 24A и 24B, задается для каждого из файла 2D и файла DEP. Как показано на фиг. 96A, в начальной точке экстента флаг начала экстента (is_located_first_in_extent_pair) назначается каждой паре из идентификатора экстента (extent_id) и SPN (SPN_extent_start).
Фиг. 96B является принципиальной схемой, показывающей взаимосвязи между экстентом EXT1[k] для воспроизведения базового вида (k=0, 1, 2, ...), принадлежащим файлу base, и флагом начала экстента, указываемым посредством начальной точки экстента. Фиг. 96C является принципиальной схемой, показывающей взаимосвязи между экстентом EXT2[k] для воспроизведения зависимого вида, принадлежащим файлу DEP, и флагом начала экстента. Фиг. 96D является принципиальной схемой, показывающей взаимосвязи между экстентом SS EXTSS[0], принадлежащим файлу SS, и блоками экстентов на BD-ROM-диске. Как показано на фиг. 96B и 96C, в паре EXT1[k], EXT2[k] экстентов, имеющих идентичный идентификатор экстента, значение флага начала экстента задается противоположным способом. В частности, экстенты, флаг начала экстента которых задается равным "1", имеют меньшее число исходных пакетов, чем экстенты, флаг начала экстента которых задается равным "0". Как показано на фиг. 96D, экстент, флаг начала экстента которого задается равным "1", размещается перед экстентом, флаг начала экстента которого задается равным "0". Таким образом, флаг начала экстента указывает, какой из EXT1[n] и EXT2[n] в паре экстентов размещается перед другим. Таким образом, можно распознавать компоновку блоков данных в паре EXT1[n], EXT2[n] экстентов из значения флага начала экстента. Соответственно, модуль 4235 управления воспроизведением может сообщать в переключатель 4220 число исходных пакетов от начала каждого экстента SS до каждой границы между блоками данных посредством использования начальной точки экстента, даже если порядок блоков данных отличается между парами экстентов. Как результат, переключатель 4220 может выделять экстенты для воспроизведения базового вида и экстенты для воспроизведения зависимого вида из экстентов SS.
Когда порядок блоков данных в каждой паре экстентов является постоянным, минимальные значения емкости RB1 и RB2 вычисляются посредством использования фиг. 90 следующим образом:
RB1≥(TJUMP_MAX+SEXT2[n]/RUD72)×RMAX1, RB2≥max{(SEXT1[n-1]/RUD72+TJUMP_MAX+SEXT2[n]/RUD72)×RMAX2, SEXT2[n]}. С другой стороны, когда порядок блоков данных может быть изменен на противоположный в паре экстентов, расположенной в середине блока экстентов, минимальные значения емкости RB1 и RB2 изменяются следующим образом.
Фиг. 97C является принципиальной схемой, показывающей компоновку блока данных, который требует самой большой емкости RB1 4221. Как показано на фиг. 97C, (M-1)-й блок 9701 экстентов и M-й блок 9702 экстентов размещаются с межслойной границей LB между ними (буква M представляет целое число, превышающее или равное 2). (N+1)-я пара D[n], B[n] экстентов размещается в начале M-го блока 9702 экстентов. В частности, блок D[n] данных для воспроизведения зависимого вида размещается перед блоком B[n] данных для воспроизведения базового вида (буква n представляет целое число, превышающее 0). С другой стороны, n-я пара D[n-1], B[n-1] экстентов размещается в конце (M-1)-го блока 9701 экстентов. В частности, блок B[n-1] данных для воспроизведения базового вида размещается перед блоком D[n-1] данных для воспроизведения зависимого вида.
Фиг. 97A и 97B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9701 и 9702 экстентов, показанных на фиг. 97C. Как показано на фиг. 97A, сохраненный объем DA1 данных в RB1 4221 достигает максимального значения DM1 в момент, когда n-й блок B[n-1] данных для воспроизведения базового вида считывается в RB1 4221. Блоки данных не считываются в RB1 4221 от непосредственно последующего периода ΔT1 считывания блока D[n-1] данных для воспроизведения зависимого вида в течение периода ΔT2, в котором длинный переход через межслойную границу LB осуществляется, и периода ΔT3 предварительной загрузки в M-том блоке 9702 экстентов. Таким образом, в течение этих периодов сохраненный объем DA1 данных сокращается. В эти периоды ΔT1-ΔT3, блоки B[k] данных для воспроизведения базового вида (k=..., n-3, n-2) вплоть до (n-1)-го блока данных для воспроизведения базового вида передаются на средней скорости REXT1[..., n-3, n-2] передачи, и затем n-й блок данных для воспроизведения базового вида передается на средней скорости REXT1[n-1] передачи. Чтобы не допускать достижения "0" посредством сохраненного объема DA1 данных до конечного момента времени периода ΔT3 предварительной загрузки, сохраненный объем DA1 данных должен, по меньшей мере, быть равным размеру SEXT1[n-1] блока B[n-1] данных для воспроизведения базового вида в момент времени, который находится до конечного момента времени на ATC-время TEXT1[n-1] экстента n-го блока B[n-1] данных для воспроизведения базового вида. Соответственно, максимальное значение DM1 сохраненного объема DA1 данных должно превышать размер SEXT1[n-1] на объем REXT1[..., n-3, n-2]×(ΔT1+ΔT2+ΔT3-TEXT1[n-1]) данных или более для данных, которые передаются из RB1 4221 в декодер 4225 системных целевых объектов в оставшиеся периоды ΔT1+ΔT2+ΔT3-TEXT1[n-1]. Другими словами, RB1 4221 должен иметь емкость RB1, которая превышает максимальное значение DM1: RB1≥SEXT1[n-1]+REXT1[..., n-3, n-2]×(ΔT1+ΔT2+ΔT3-TEXT1[n-1]). Здесь, время ΔT2 длинного перехода оценивается как максимальное время TJUMP_MAX перехода для длинного перехода.
Фиг. 97F является принципиальной схемой, показывающей компоновку блока данных, который требует самой большой емкости RB2 4222. Как показано на фиг. 97F, (N-1)-й блок 9703 экстентов и N-й блок 9704 экстентов размещаются с межслойной границей LB между ними (буква N представляет целое число, превышающее или равное 2). (N+1)-я пара D[n], B[n] экстентов размещается в начале N-го блока 9704 экстентов. В частности, блок D[n] данных для воспроизведения зависимого вида размещается после блока B[n] данных для воспроизведения базового вида. С другой стороны, n-я пара D[n-1], B[n-1] экстентов размещается в конце (N-1)-го блока 9703 экстентов. В частности, блок B[n-1] данных для воспроизведения базового вида размещается после блока D[n-1] данных для воспроизведения зависимого вида.
Фиг. 97D и 97E являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из двух блоков 9703 и 9704 экстентов, показанных на фиг. 97F. Как показано на фиг. 97E, сохраненный объем DA2 данных в RB2 4222 достигает максимального значения DM2 в момент, когда n-й блок D[n-1] данных для воспроизведения зависимого вида считывается в RB2 4222. Блоки данных не считываются в RB2 4222 от непосредственно последующего периода ΔT4 считывания блока B[n-1] данных для воспроизведения базового вида в течение периода ΔT5, в котором длинный переход через межслойную границу LB осуществляется, и периода ΔT6 предварительной загрузки в N-ном блоке 9704 экстентов. Таким образом, в течение этих периодов сохраненный объем DA2 данных сокращается. В эти периоды ΔT4-ΔT6, блоки D[k] данных для воспроизведения зависимого вида (k=..., n-3, n-2) вплоть до (n-1) блока данных для воспроизведения зависимого вида передаются на средней скорости REXT2[..., n-3, n-2] передачи, и затем n-й блок данных для воспроизведения зависимого вида передается на средней скорости REXT2[n-1] передачи. Чтобы не допускать достижения "0" посредством сохраненного объема DA2 данных до конечного момента времени периода ΔT6 предварительной загрузки, сохраненный объем DA2 данных должен, по меньшей мере, быть равным размеру SEXT2[n-1] блока D[n-1] данных для воспроизведения зависимого вида в момент времени, который находится до конечного момента времени на ATC-время TEXT2[n-1] экстента n-го блока D[n-1] данных для воспроизведения зависимого вида. Соответственно, максимальное значение DM2 сохраненного объема DA2 данных должен превышать размер SEXT2[n-1] на объем REXT2[..., n-3, n-2]×(ΔT4+ΔT5+ΔT6-TEXT2[n-1]) данных или более для данных, которые передаются из RB2 4222 в декодер 4225 системных целевых объектов в оставшиеся периоды ΔT4+ΔT5+ΔT6-TEXT2[n-1]. Другими словами, RB2 4222 должен иметь емкость RB2, которая превышает максимальное значение DM2: RB2>SEXT2[n-1]+REXT2[..., n-3, n-2]×(ΔT4+ΔT5+ΔT6-TEXT2[n-1]). Здесь, время ΔT5 длинного перехода оценивается как максимальное время TJUMP_MAX перехода для длинного перехода.
Когда порядок блоков данных может быть изменен на противоположный в паре экстентов, расположенной в середине блока экстентов, условия 2, 3 для пары экстентов, а именно, выражения 2, 3 дополнительно модифицируются следующим образом.
Фиг. 98C является принципиальной схемой, показывающей блок 9810 экстентов, который включает в себя в середине пару экстентов, в которой порядок блоков данных изменяется на противоположный. Как показано на фиг. 98C, в (n+2)-й паре D[n+1], B[n+1] экстентов, блок D[n+1] данных для воспроизведения зависимого вида находится после блока B[n] данных для воспроизведения базового вида. В парах D[n], B[n] и D[n+1], B[n+1] экстентов, которые находятся до и после них, блок B[n], B[n+1] данных для воспроизведения базового вида размещается после блока D[n], D[n+1] данных для воспроизведения зависимого вида, соответственно.
Фиг. 98A и 98B являются графиками, показывающими изменения объемов DA1, DA2 данных, сохраненных в RB1 4221 и RB2 4222, соответственно, когда трехмерные видеоизображения воспроизводятся плавно из блока 9801 экстентов, показанного на фиг. 98C. Здесь, период времени перехода через нуль секторов игнорируется, поскольку он намного меньше других периодов. Как показано на фиг. 98A и 98B, в течение периода PRD[n] считывания (n+1)-го блока D[n] данных для воспроизведения зависимого вида, сохраненный объем DA2 данных в RB2 4222 увеличивается на скорости, равной RUD72-REXT2[n], разности между скоростью RUD72 считывания и скоростью REXT2[n] передачи для воспроизведения зависимого вида, при этом сохраненный объем DA1 данных в RB1 4221 уменьшается на скорости REXT1[n-1] передачи для воспроизведения базового вида. В течение периода PRB[n] считывания (n+1)-го блока B[n] данных для воспроизведения базового вида, сохраненный объем DA1 данных в RB1 4221 увеличивается на скорости, равной RUD72-REXT1[n], разности между скоростью RUD72 считывания и скоростью REXT1[n] передачи для воспроизведения базового вида, при этом сохраненный объем DA2 данных в RB2 4222 снижается на скорости REXT2[n] передачи для воспроизведения зависимого вида. В течение периода PRB[n+1] считывания (n+2)-го блока B[n+1] данных для воспроизведения базового вида, сохраненный объем DA1 данных в RB1 4221 увеличивается на скорости, равной RUD72-REXT1[n-1], разности между скоростью RUD72 считывания и скоростью REXT1[n+1] передачи для воспроизведения базового вида, при этом сохраненный объем DA2 данных в RB2 4222 дополнительно снижается на скорости REXT2[n+1] передачи для воспроизведения зависимого вида. Кроме того, в течение периода PRD[n+1] считывания (n+2)-го блока D[n+1] данных для воспроизведения зависимого вида, сохраненный объем DA2 данных в RB2 4222 увеличивается на скорости, равной RUD72-REXT2[n+1], разности между скоростью RUD72 считывания и скоростью REXT2[n+1] передачи для воспроизведения зависимого вида, при этом сохраненный объем DA1 данных в RB1 4221 снижается на скорости REXT1[n] передачи для воспроизведения базового вида. После этого, в течение периода считывания PRD[n+2] (n+3)-его блока D[n+2] данных для воспроизведения зависимого вида, сохраненный объем DA2 данных в RB2 4222 увеличивается на скорости, равной RUD72-REXT2[n+2], разности между скоростью RUD72 считывания и скоростью REXT2[n+2] передачи для воспроизведения зависимого вида, при этом сохраненный объем DA1 данных в RB1 4221 снижается на скорости REXT1[n+1] передачи для воспроизведения базового вида.
В этом случае, чтобы воспроизводить трехмерные видеоизображения плавно из блока 9810 экстентов, во-первых, ATC-время экстента (n+1)-го блока D[n] данных для воспроизведения зависимого вида должно быть равным или превышающим период времени от начального момента времени периода PRD[n] считывания до начального момента времени периода PRD[n+1] считывания следующего блока D[n+1] данных для воспроизведения зависимого вида. Затем, ATC-время экстента (n+1)-го, (n+2)-го блока B[n], B[n+1] данных для воспроизведения базового вида должно быть равным или превышающим период времени от начального момента времени периода PRB[n], PRB[n+1] считывания до начального момента времени периода PRB[n+2] считывания следующего блока B[n+2] данных для воспроизведения зависимого вида. Эти условия представляются посредством выражений 2A и 3A вместо выражений 2 и 3, когда экстент B (EXTB) предположительно размещается перед экстентом A (EXTA) в n-й паре экстентов.
(2A)
(3A)
Здесь, выражение 2A получается посредством замены размера SEXT1[n] блока B[n] данных для воспроизведения базового вида, размера SEXT2[n+1] блока D[n+1] данных для воспроизведения зависимого вида и скорости REXT1[n] передачи для воспроизведения базового вида, включенных в выражение 2, на размер SEXTA[n] экстента A, размер SEXTB[n+1] экстента B и среднюю скорость SEXTA[n] передачи для экстента A, соответственно. Выражение 3A получается посредством замены размера SEXT1[n] блока B[n] данных для воспроизведения базового вида, размера SEXT2[n] блока D[n] данных для воспроизведения зависимого вида и скорости REXT2[n] передачи для воспроизведения зависимого вида, включенных в выражение 3, на размер SEXTA[n] экстента A, размер SEXTB[n] экстента B и среднюю скорость REXTB[n] передачи для экстента B, соответственно. Следует отметить, что в каждом из выражений 2A и 3A, время TJUMP0 перехода через нуль секторов рассматривается как "0".
Фиг. 99 является принципиальной схемой, показывающей взаимосвязи между блоком 9900 экстентов, который включает в себя в середине пару экстентов, в которой порядок блоков данных изменяется на противоположный, и файлами 9910-9920 AV-потока. Как показано на фиг. 99, в третьей паре D[2], B[2] экстентов, блок D[2] данных для воспроизведения зависимого вида размещается после блока B[2] данных для воспроизведения базового вида. В других парах D[k], B [k] экстентов (k=0, 1, 3), блок B[k] данных для воспроизведения базового вида размещается после блока D[k] данных для воспроизведения зависимого вида. Каждый из блоков B[n] данных для воспроизведения базового вида (n=0, 1, 2, 3, ...) принадлежит файлу base 9911 как один экстент EXT1[n] для воспроизведения базового вида. Каждый из блоков D[n] данных для воспроизведения зависимого вида принадлежит файлу DEP 9911 как один экстент EXT2[n] для воспроизведения зависимого вида. Весь блок 9900 экстентов принадлежит файлу SS 9920 как один экстент SS EXTSS[0]. Блоки B[n] данных для воспроизведения базового вида (n=0, 1, 2, 3, ...) дополнительно принадлежат файлу 2D 9910 как двумерный экстент EXT2D[n]. Здесь, к двум последовательным блокам B[1] и B[2] данных для воспроизведения базового вида обращаются как к одному двумерному экстенту EXT2D[1]. При такой структуре, размер SEXT2D[1] двумерного экстента EXT2D[1] удовлетворяет выражению 1, даже если весь размер SEXT2[2]+SEXT2[3] двух блоков D[2], D[3] данных для воспроизведения зависимого вида, размещаемых непосредственно после него, является большим.
<Разделение пути воспроизведения до и после межслойной границы>
На фиг. 21, путь 2101 воспроизведения в режиме двумерного воспроизведения и пути 2102 воспроизведения в режиме трехмерного воспроизведения пересекают один блок B[3] данных для воспроизведения базового вида непосредственно перед длинным переходом JLY, который перескакивает через межслойную границу LB. Другими словами, этот блок B[3] данных для воспроизведения базового вида считывается как второй двумерный экстент EXT2D[1] посредством устройства 102 воспроизведения в режиме двумерного воспроизведения и как последний блок данных в экстенте SS EXTSS[1] посредством устройства 102 воспроизведения в режиме трехмерного воспроизведения. Объем данных, которые должны обрабатываться посредством декодера системных целевых объектов во время длинного перехода JLY гарантируется посредством размера блока B[3] данных для воспроизведения базового вида через условие 1 в режиме двумерного воспроизведения. С другой стороны, в режиме трехмерного воспроизведения, объем данных гарантируется посредством размера всего второго блока 1902 экстентов через условие 4. Соответственно, минимальный размер экстента блока B[3] данных для воспроизведения базового вида, как требуется посредством условия 1, в общем, превышает минимальный размер экстента согласно условию 2. Следовательно, емкость RB1 4221 должна превышать минимальное значение, необходимое для плавного воспроизведения в режиме трехмерного воспроизведения. Кроме того, ATC-времена экстента являются идентичными для блока B[3] данных для воспроизведения базового вида и непосредственно предшествующего блока D[3] данных для воспроизведения зависимого вида. Соответственно, размер блока D[3] данных для воспроизведения зависимого вида, в общем, превышает минимальный размер экстента, требуемый для блока D[3] данных согласно условию 2. Следовательно, емкость RB2 4222, в общем, превышает минимальное значение, необходимое для плавного воспроизведения в режиме трехмерного воспроизведения. В компоновке, показанной на фиг. 21, два блока 1902 и 1903 экстентов тем самым могут плавно соединяться, но емкость RB1 4221 и RB2 4222 должна поддерживаться достаточно большой.
Чтобы уменьшать емкость RB1 4221 и RB2 4222 при одновременном предоставлении возможности плавного воспроизведения видеоизображений во время длинного перехода JLY, изменения могут быть произведены в перемеженной компоновке блоков данных до или после позиции, в которой длинный переход JLY является необходимым, такой как межслойная граница LB, чтобы создавать отдельные пути воспроизведения в режиме двумерного воспроизведения и режиме трехмерного воспроизведения. Эти изменения представляются, например, посредством следующих двух типов компоновок 1 и 2. При любой из компоновок 1 и 2 путь воспроизведения непосредственно перед длинным переходом JLY пересекает различные блоки данных для воспроизведения базового вида в каждом рабочем режиме. Как описано ниже, это предоставляет возможность устройству 102 воспроизведения легко выполнять плавное воспроизведение видеоизображений во время длинного перехода JLY при одновременном сохранении минимально необходимой емкости RB1 4221 и RB2 4222.
<<Компоновка 1>>
Фиг. 100 является принципиальной схемой, показывающей компоновку 1 группы блоков данных, записанной до и после межслойной границы LB на BD-ROM-диске 101. Как показано на фиг. 100, первый блок A001 экстентов записывается перед межслойной границей LB, а второй блок A002 экстентов записывается после межслойной границы LB. В блоках A001 и A002 экстентов, блоки D[n] данных для воспроизведения зависимого вида и блоки B[n] данных для воспроизведения базового вида формируют перемеженную компоновку (n=..., 0, 1, 2, 3, ...). В частности, ATC-времена экстента являются идентичными для n-й пары экстентов D[n] и B[n]. В компоновке 1, один блок B[2]2D данных для воспроизведения базового вида дополнительно размещается между концом B[1] первого блока A001 экстентов и межслойной границей LB. Этот блок B[2]2D данных для воспроизведения базового вида совпадает с точностью до бита с блоком B[2]SS данных для воспроизведения базового вида в начале второго блока A002 экстентов. В дальнейшем в этом документе, B[2]2D упоминается как "блок исключительно для двумерного воспроизведения", а B[2]SS упоминается как "блок исключительно для SS-воспроизведения".
К блокам данных для воспроизведения базового вида, показанным на фиг. 100, может осуществляться доступ как к экстентам в файле 2D A010, т.е. как к двумерным экстентам EXT2D[•], за исключением блока исключительно для SS-воспроизведения B[2]SS. Например, к блоку B[0] данных для воспроизведения базового вида, второму от конца первого блока A001 экстентов, паре B[1]+B[2]2D из последнего блока B[1] данных для воспроизведения базового вида и блока исключительно для двумерного воспроизведения B[2]2D и второму блоку B[3] данных для воспроизведения базового вида во втором блоке A002 экстентов может, соответственно, осуществляться доступ как к отдельным двумерным экстентам EXT2D[0], EXT2D[1] и EXT2D[2]. С другой стороны, к каждому из блоков D[n] данных для воспроизведения зависимого вида (n=..., 0, 1, 2, 3, ...), показанных на фиг. 100, может осуществляться доступ как к одному экстенту в файле DEP A012, т.е. как к экстентам EXT2[n] для воспроизведения зависимого вида.
Для групп блоков данных, показанных на фиг. 100, перекрестное связывание файлов AV-потока выполняется следующим образом. Ко всем блокам A001 и A002 экстентов может, соответственно, осуществляться доступ как к одному экстенту EXTSS[0] и EXTSS[1] в файле SS A020. Соответственно, блоки B[0], B[1] и B [3] данных для воспроизведения базового вида в блоках A001 и A002 экстентов совместно используются посредством файла 2D A010 и файла SS A020. С другой стороны, к блоку исключительно для двумерного воспроизведения B[2]2D может осуществляться доступ только как к части двумерного экстента EXT2D[1], расположенной непосредственно перед межслойной границей LB. С другой стороны, к блоку исключительно для SS-воспроизведения B[2]SS может осуществляться доступ только как к части экстента SS EXTSS[1], расположенной непосредственно после межслойной границы LB. Следовательно, блоки данных для воспроизведения базового вида, отличные от блока исключительно для двумерного воспроизведения B[2]2D, т.е. B[0], B[1], B[2]SS и B [3], могут извлекаться из экстентов SS EXTSS[0], EXTSS[1] как экстенты в файле base A011, т.е. экстенты EXT1[n] для воспроизведения базового вида (n=0, 1, 2, 3).
Фиг. 101 является принципиальной схемой, показывающей путь A110 воспроизведения в режиме двумерного воспроизведения и путь A120 воспроизведения в режиме трехмерного воспроизведения для группы блоков данных в компоновке 1, показанной на фиг. 100. Устройство 102 воспроизведения в режиме двумерного воспроизведения воспроизводит файл 2D A010. Соответственно, как показано посредством пути A110 воспроизведения в режиме двумерного воспроизведения, блок B[0] данных для воспроизведения базового вида, второй от конца первого блока A001 экстентов, считывается как первый двумерный экстент, EXT2D[0], и затем считывание непосредственно последующего блока D[1] данных для воспроизведения зависимого вида пропускается посредством перехода J2D1. Затем, пара B[1]+B[2]2D из последнего блока B[1] данных для воспроизведения базового вида в первом блоке A001 экстентов и непосредственно последующего блока исключительно для двумерного воспроизведения B[2]2D считывается непрерывно как второй двумерный экстент EXT2D[1]. Длинный переход JLY осуществляется в непосредственно последующей межслойной границе LB, и считывание трех блоков D[2], B[2]SS и D[3] данных, расположенных в начале второго блока A002 экстентов, пропускается. Затем, второй блок B[3] данных для воспроизведения базового вида во втором блоке A002 экстентов считывается как третий двумерный экстент EXT2D[2]. С другой стороны, устройство 102 воспроизведения в режиме трехмерного воспроизведения воспроизводит файл SS A020. Соответственно, как показано посредством пути A120 воспроизведения в режиме трехмерного воспроизведения, весь первый блок A001 экстентов непрерывно считывается как первый экстент SS EXTSS[0]. Непосредственно после этого, длинный переход JLY осуществляется, и считывание блока исключительно для двумерного воспроизведения B[2]2D пропускается. Затем, весь второй блок A002 экстентов считывается непрерывно как второй экстент SS EXTSS[1].
Как показано на фиг. 100, в режиме двумерного воспроизведения, блок исключительно для двумерного воспроизведения B[2]2D считывается, при этом считывание блока исключительно для SS-воспроизведения B[2]SS пропускается. В отличие от этого, в режиме трехмерного воспроизведения, считывание блока исключительно для двумерного воспроизведения B[2]2D пропускается, при этом блок исключительно для SS-воспроизведения B[2]SS считывается. Тем не менее, поскольку блоки B[2]2D и B[2]SS данных совпадают с точностью до бита, видеокадры для воспроизведения базового вида, которые воспроизводятся, являются идентичными в обоих режимах воспроизведения. В компоновке 1 путь A110 воспроизведения в режиме двумерного воспроизведения и путь A120 воспроизведения в режиме трехмерного воспроизведения разделяются до и после длинного перехода JLY таким образом. Соответственно, в отличие от компоновки, показанной на фиг. 21, размер SEXT2D[1] двумерного экстента EXT2D[1], расположенного непосредственно перед межслойной границей LB, и размер SEXT2[1] непосредственно предшествующего блока D[1] данных для воспроизведения зависимого вида может быть определен отдельно следующим образом.
Размер SEXT2D[1] двумерного экстента EXT2D[1] равен SEXT1[1]+S2D, сумме размера SEXT1[1] блока B[1] данных для воспроизведения базового вида и размера S2D блока исключительно для двумерного воспроизведения B[2]2D. Соответственно, для плавного воспроизведения двумерных видеоизображений, эта сумма SEXT1[1]+S2D должна удовлетворять выражению 1. Максимальное время TJUMP_MAX перехода для длинного перехода JLY подставляется в правую сторону выражения 1 как время TJUMP-2D перехода. Затем, число секторов от конца блока исключительно для двумерного воспроизведения B[2]2D до первого двумерного экстента EXT2D[2]=B[3] во втором блоке A002 экстентов должно быть равным или меньшим максимального расстояния SJUMP_MAX перехода для длинного перехода JLY, указываемого в соответствии с характеристиками устройства двумерного воспроизведения.
С другой стороны, для плавного воспроизведения трехмерных видеоизображений, размеры SEXT2[1] и SEXT1[1] блока D[1] данных для воспроизведения зависимого вида и блока B[1] данных для воспроизведения базового вида, расположенных в конце первого экстента SS EXTSS[0], должен удовлетворять выражениям 3 и 2. Независимо от осуществления длинного перехода JLY типичное значение для времени перехода через нуль секторов должно подставляться в правую сторону выражений 3 и 2 как времена TJUMP0[2n+1] и TJUMP0[2n+2] перехода через нуль секторов. Затем, размер первого экстента SS EXTSS[0] должен удовлетворять условию 4. Кроме того, число секторов от конца этого экстента SS EXTSS[0] до начала экстента SS EXTSS[1] должно быть равным или меньшим максимального расстояния SJUMP_MAX перехода для длинного перехода JLY, указываемого в соответствии с характеристиками устройства трехмерного воспроизведения.
В рамках двумерного экстента EXT2D[1], расположенного непосредственно перед межслойной границей LB, только блок B[1] данных для воспроизведения базового вида, расположенный перед двумерным экстентом EXT2D[1], совместно используется с первым экстентом SS EXTSS[0]. Соответственно, посредством надлежащего увеличения размера S2D блока исключительно для двумерного воспроизведения B[2]2D, размер SEXT1[1] блока B[1] данных для воспроизведения базового вида дополнительно может быть ограничен при сохранении размера SEXT2D[1]=SEXT1[1]+S2D двумерного экстента EXT2D[1] постоянным. В этом случае, ATC-время экстента блока B[1] данных для воспроизведения базового вида сокращается. Как результат, размер SEXT2[1] блока D[1] данных для воспроизведения зависимого вида, расположенного непосредственно впереди, также дополнительно может быть ограничен.
Поскольку блок исключительно для SS-воспроизведения B[2]SS и блока исключительно для двумерного воспроизведения B[2]2D совпадают с точностью до бита, увеличение размера S2D блока исключительно для двумерного воспроизведения B[2]2D увеличивает размер блока D[2] данных для воспроизведения зависимого вида, расположенного непосредственно перед блоком исключительно для SS-воспроизведения B[2]SS. Тем не менее, этот размер может быть задан существенно меньшим размера блока D[3] данных для воспроизведения зависимого вида, расположенного непосредственно перед межслойной границей LB, показанной на фиг. 21. Емкость RB1 4221 и RB2 4222 тем самым может быть еще приближена к минимальному объему, необходимому для плавного воспроизведения трехмерных видеоизображений. Таким образом, можно задавать каждый блок данных в компоновке 1 равным размеру, при котором плавное воспроизведение двумерных и трехмерных изображений во время длинного перехода возможно при сохранении емкости буфера считывания, которая должна быть гарантирована в устройстве 102 воспроизведения, на минимально необходимом уровне.
В компоновке 1, дублированные данные блока исключительно для двумерного воспроизведения B[2]2D размещаются в первом блоке A001 экстентов как один блок исключительно для SS-воспроизведения B[2]SS. Альтернативно, эти дублированные данные могут разделяться на два или более блоков исключительно для SS-воспроизведения.
<<Компоновка 2>>
Фиг. 102 является принципиальной схемой, показывающей компоновку 2 группы блоков данных, записанной до и после межслойной границы LB на BD-ROM-диске 101. Как показано посредством сравнения фиг. 102 с фиг. 100, компоновка 2 отличается от компоновки 1 в том, что блок A202 экстентов, который включает в себя блоки исключительно для SS-воспроизведения B[2]SS и B[3]SS, находится непосредственно перед межслойной границей LB.
Как показано на фиг. 102, первый блок A201 экстентов, блок исключительно для двумерного воспроизведения (B[2]+B[3])2D и второй блок A202 экстентов находятся до межслойной границы LB в этом порядке, а третий блок A203 экстентов находится после межслойной границы LB. В блоках A201-A203 экстентов, блоки D[n] данных для воспроизведения зависимого вида и блоки B[n] данных для воспроизведения базового вида формируют перемеженную компоновку (n=..., 0, 1, 2, 3, 4, ...). В частности, ATC-времена экстента являются идентичными для n-й пары D[n] и B[n] экстентов. Во втором блоке A202 экстентов потоковые данные являются непрерывными с блоками D[1] и B[1] данных, расположенными в конце первого блока A201 экстентов, и блоками D[4] и B [4] данных, расположенными в начале третьего блока A203 экстентов. Блоки данных для воспроизведения базового вида, включенные во второй блок A202 экстентов, являются блоками исключительно для SS-воспроизведения B[2]SS и B[3]SS, и комбинация этих блоков B[2]SS+B[3]SS совпадает с точностью до бита с блоком исключительно для двумерного воспроизведения (B[2]+B[3])2D, расположенным перед вторым блоком A202 экстентов.
В рамках блока данных для воспроизведения базового вида, показанного на фиг. 102, к блокам данных, отличным от блоков исключительно для SS-воспроизведения B[2]SS и B[3]SS, может осуществляться доступ как к экстентам EXT2D[0], EXT2D[1] и EXT2D[2] в файле 2D A210. В частности, к паре из последнего блока B[1] данных для воспроизведения базового вида и блока исключительно для двумерного воспроизведения (B[2]+B[3])2D в первом блоке A201 экстентов может осуществляться доступ как к одному двумерному экстенту EXT2D[1]. Кроме того, блоки данных для воспроизведения базового вида, не расположенные во втором блоке A202 экстентов, т.е. блоки B[0], B[1] и B[4] данных в блоках A201 и A203 экстентов, также могут извлекаться как экстенты EXT1[0], EXT1[1] и EXT1[4] в файле base A211 из экстентов EXTSS[0] и EXTSS[1] в файле SS A220. Наоборот, к блоку исключительно для двумерного воспроизведения (B[2]+B[3])2D может осуществляться доступ только как к части двумерного экстента EXT2D[1]. С другой стороны, блоки исключительно для SS-воспроизведения B[2]SS и B[3]SS могут извлекаться из экстента SS EXTSS[1] как экстенты EXT1[2] и EXT1[3] для воспроизведения базового вида.
Фиг. 103 является принципиальной схемой, показывающей путь A310 воспроизведения в режиме двумерного воспроизведения и путь A320 воспроизведения в режиме трехмерного воспроизведения для группы блоков данных в компоновке 2, показанной на фиг. 102. Устройство 102 воспроизведения в режиме двумерного воспроизведения воспроизводит файл 2D A210. Соответственно, как показано посредством пути A310 воспроизведения в режиме двумерного воспроизведения, блок B[0] данных для воспроизведения базового вида, второй от конца первого блока A201 экстентов считывается, как первый двумерный экстент, EXT2D[0] и затем считывание непосредственно последующего блока D[1] данных для воспроизведения зависимого вида пропускается посредством перехода J2D1. Затем, пара из последнего блока B[1] данных для воспроизведения базового вида в первом блоке A201 экстентов и непосредственно последующего блока исключительно для двумерного воспроизведения (B[2]+B[3])2D непрерывно считывается как второй двумерный экстент EXT2D[1]. Длинный переход JLY осуществляется непосредственно после этого, и считывание второго блока A202 экстентов и блока D[4] данных для воспроизведения зависимого вида, расположенного в начале третьего блока A203 экстентов, пропускается. Затем, первый блок B[4] данных для воспроизведения базового вида в третьем блоке A203 экстентов считывается как третий двумерный экстент EXT2D[2]. Устройство 102 воспроизведения в режиме трехмерного воспроизведения воспроизводит файл SS A220. Соответственно, как показано посредством пути A320 воспроизведения в режиме трехмерного воспроизведения, весь первый блок A201 экстентов непрерывно считывается как первый экстент SS EXTSS[0]. Переход JEX осуществляется непосредственно после этого, и считывание блока исключительно для двумерного воспроизведения (B[2]+B[3])2D пропускается. Затем, весь второй блок A202 экстентов считывается непрерывно как второй экстент SS EXTSS[1]. Непосредственно после этого, длинный переход JLY, чтобы перескакивать через межслойную границу LB, осуществляется. Затем, весь третий блок A203 экстентов считывается непрерывно как третий экстент SS EXTSS[2].
Как показано на фиг. 103, в режиме двумерного воспроизведения, блок исключительно для двумерного воспроизведения (B[2]+B[3])2D считывается, при этом считывание блоков исключительно для SS-воспроизведения B[2]SS и B[3]SS пропускается. В отличие от этого, в режиме трехмерного воспроизведения, считывание блока исключительно для двумерного воспроизведения (B[2]+B[3])2D пропускается, при этом блоки исключительно для SS-воспроизведения B[2]SS и B[3]SS считываются. Тем не менее, поскольку блок исключительно для двумерного воспроизведения (B[2]+B[3])2D совпадает со всеми блоками исключительно для SS-воспроизведения B[2]SS+B[3]SS с точностью до бита, видеокадры для воспроизведения базового вида, которые воспроизводятся, являются идентичными в обоих режимах воспроизведения. В компоновке 2 путь A310 воспроизведения в режиме двумерного воспроизведения и путь A320 воспроизведения в режиме трехмерного воспроизведения разделяются до и после длинного перехода JLY таким образом. Соответственно, размер SEXT2D[1] двумерного экстента EXT2D[1], расположенного непосредственно перед межслойной границей LB, и размер SEXT2[1] непосредственно предшествующего блока D[1] данных для воспроизведения зависимого вида могут быть определены отдельно, как указано ниже.
Размер SEXT2D[1] двумерного экстента EXT2D[1] равен SEXT1[1]+S2D, сумме размера SEXT1[1] блока B[1] данных для воспроизведения базового вида и размера S2D блока исключительно для двумерного воспроизведения (B[2]+B[3])2D. Соответственно, для плавного воспроизведения двумерных видеоизображений, эта сумма SEXT1[1]+S2D должна удовлетворять выражению 1. Максимальное время TJUMP_MAX перехода для длинного перехода JLY подставляется в правую сторону выражения 1 как время TJUMP-2D перехода. Затем, число секторов от конца блока исключительно для двумерного воспроизведения (B[2]+B[3])2D до первого двумерного экстента EXT2D[2]=B[4] в третьем блоке A203 экстентов должно быть равным или меньшим максимального расстояния SJUMP_MAX перехода для длинного перехода JLY, указываемого в соответствии с характеристиками устройства двумерного воспроизведения.
С другой стороны, для плавного воспроизведения трехмерных видеоизображений, размеры SEXT2[1] и SEXT1[1] блока D[1] данных для воспроизведения зависимого вида и блока B[1] данных для воспроизведения базового вида, расположенных в конце первого экстента SS EXTSS[0], должны удовлетворять выражениям 3 и 2. Независимо от осуществления длинного перехода JEX типичное значение для времени перехода через нуль секторов должно подставляться в правую сторону выражений 3 и 2 как времена TJUMP0[2n+1] и TJUMP0[2n+2] перехода через нуль секторов. Затем, размеры SEXT2[3] и SEXT1[3] блока D[3] данных для воспроизведения зависимого вида и блока исключительно для SS-воспроизведения B[3]SS, расположенных в конце второго экстента SS EXTSS[1], должны удовлетворять выражениям 3 и 2. Независимо от осуществления длинного перехода JLY типичное значение для времени перехода через нуль секторов должно подставляться в правую сторону выражений 3 и 2 как времена TJUMP0[2n+1] и TJUMP0[2n+2] перехода через нуль секторов.
Только блок B[1] данных для воспроизведения базового вида, расположенный перед двумерным экстентом EXT2D[1], совместно используется с экстентом SS EXTSS[1]. Соответственно, посредством надлежащего увеличения размера S2D блока исключительно для двумерного воспроизведения B[2]2D, размер SEXT1[1] блока B[1] данных для воспроизведения базового вида дополнительно может быть ограничен при сохранении размера SEXT2D[1]=SEXT1[1]+S2D двумерного экстента EXT2D[1] постоянным. Как результат, размер SEXT2[1] блока D[1] данных для воспроизведения зависимого вида, расположенного непосредственно впереди, также дополнительно может быть ограничен.
Блоки исключительно для SS-воспроизведения B[2]SS+B[3]SS полностью совпадают с блоком исключительно для двумерного воспроизведения (B[2]+B[3])2D с точностью до бита. Соответственно, увеличение размера S2D блока исключительно для двумерного воспроизведения (B[2]+B[3])2D увеличивает размеры блоков D[2] и D[3] данных для воспроизведения зависимого вида, соответственно, расположенных непосредственно перед блоками исключительно для SS-воспроизведения B[2]SS и B[3]SS. Тем не менее, предусмотрено два блока исключительно для SS-воспроизведения B[2]SS и B[3]SS по сравнению с одним блоком исключительно для двумерного воспроизведения (B[2]+B[3])2D. Как результат, размеры каждого из блоков исключительно для SS-воспроизведения B[2]SS и B[3]SS могут быть заданы достаточно небольшими. Емкость RB1 4221 и RB2 4222 тем самым дополнительно может уменьшаться до минимального объема, необходимого для плавного воспроизведения трехмерных видеоизображений. Таким образом, можно задавать каждый блок данных в компоновке 2 равным размеру, при котором плавное воспроизведение двумерных и трехмерных изображений возможно при сохранении емкости буфера считывания, которая должна быть гарантирована в устройстве 102 воспроизведения, на минимально необходимом уровне.
Как пояснено со ссылкой на фиг. 90, чем меньше размер блока данных, размещаемого в конце блока экстентов, находящегося непосредственно перед длинным переходом, тем меньше нижний предел емкости RB2 4222. Соответственно, компоновка 2 предпочтительно задается, чтобы удовлетворять следующим двум условиям. В этом случае, во втором блоке A202 экстентов, который включает в себя блоки исключительно для трехмерного воспроизведения B[2]SS и B[3]SS, каждый блок данных имеет достаточно небольшой размер. Как результат, нижний предел емкости RB2 4222 дополнительно может уменьшаться.
Первое условие состоит в том, что верхний предел указывается для размера блока исключительно для двумерного воспроизведения (B[2]+B[3])2D, размещаемого непосредственно перед вторым блоком A202 экстентов. Например, как показано на фиг. 103, размер S2D блока исключительно для двумерного воспроизведения (B[2]+B[3])2D ограничен тем, чтобы быть равным или меньшим 20000 секторов. Верхний предел зависит от производительности переходов устройства двумерного воспроизведения. Второе условие состоит в том, что верхний предел TEXT_3D_MAX указывается для ATC-времени экстента блоков исключительно для трехмерного воспроизведения B[2]SS и B[3]SS. Другими словами, размер блоков исключительно для трехмерного воспроизведения B[2]SS и B[3]SS удовлетворяет, вместо выражения 1, следующему выражению: SEXT1[n]≤REXT1[n]×TEXT_3D_MAX. Верхний предел TEXT_3D_MAX задается равным, например, 0,5 секунды.
Фиг. 104 является принципиальной схемой, показывающей взаимосвязи между временем SEXT1[3]/RUD72 считывания блока исключительно для трехмерного воспроизведения B[3]SS, расположенного в конце второго блока A202 экстентов, и нижним пределом емкости RB2 4222. Как показано на фиг. 104, сохраненный объем DA2 данных в RB2 4222 достигает максимального значения DM2 в точке в начале считывания блока исключительно для трехмерного воспроизведения B[3]SS. Максимальное значение DM2 равно или превышает значение, которое получается посредством умножения скорости REXT2 передачи для воспроизведения зависимого вида[3] на сумму длины SEXT1[3]/RUD72 периода считывания блока исключительно для трехмерного воспроизведения B[3]SS, времени, требуемого для длинного перехода TLY, и длины SEXT2[4]/RUD72 периода предварительной загрузки: DM2≥(SEXT1[3]/RUD72+TLY+SEXT2[4]/RUD72)×REXT2[3]. Соответственно, если размером блока исключительно для трехмерного воспроизведения B[3]SS является значение SL[3], которое превышает вышеуказанное, длина SL[3]/RUD72 периода считывания увеличивается. Таким образом, как показано посредством пунктирной линии на фиг. 104, максимальное значение DM20 сохраненного объема DA2 данных в RB2 4222 увеличивается. По этой причине, вышеописанные два условия используются для того, чтобы ограничивать размер каждого из блоков исключительно для трехмерного воспроизведения B[2]SS, B[3]SS небольшим значением. Это предоставляет возможность дополнительного уменьшения нижнего предела емкости RB2 4222.
Следует отметить, что для удовлетворения условия 4, размер блока данных, размещаемого в начале каждого блока экстентов, а именно, длина периода предварительной загрузки должна поддерживаться достаточно большой. Таким образом, относительно блока исключительно для трехмерного воспроизведения, размещаемого в начале блока экстентов, его ATC-время экстента может превышать верхний предел TEXT_3D_MAX.
Компоновка 2 может предоставляться в позиции, в которой воспроизведение с прерываниями может быть запущено, а также перед межслойной границей LB. На фиг. 102, вершины треугольников A230, A231 и A232 указывают позиции, в которых воспроизведение с прерываниями может быть запущено, а именно, позиции на BD-ROM-диске, в которых записаны точки входа. Точка входа, указываемая посредством белого треугольника A230, представляет позицию, в которой воспроизведение с прерываниями может быть запущено в режиме двумерного воспроизведения. Точки входа, указываемые посредством черных треугольников A231 и A232, представляют позиции, в которых воспроизведение с прерываниями может быть запущено в режиме трехмерного воспроизведения. Каждый из блоков исключительно для трехмерного воспроизведения B[2]SS, B[3]SS имеет значительно меньший размер, чем блок исключительно для двумерного воспроизведения (B[2]+B[3])2D, и тем самым размер соответствующего блока D[2], D[3] данных для воспроизведения зависимого вида является достаточно небольшим. Как результат, когда воспроизведение с прерываниями выполняется в режиме трехмерного воспроизведения, время, требуемое от начала доступа к точке A231, A232 входа до начала декодирования блока D[2], B[2]SS данных, является небольшим. Другими словами, воспроизведение с прерываниями в режиме трехмерного воспроизведения запускается быстро.
В компоновке 2 дублированные данные блока исключительно для двумерного воспроизведения (B[2]+B[3])2D разделяются на два блока исключительно для SS-воспроизведения B[2]SS и B[3]SS. Альтернативно, дублированные данные могут быть одним блоком исключительно для SS-воспроизведения или могут разделяться на три или более блоков исключительно для SS-воспроизведения.
<Флаг пары экстентов>
Фиг. 105 является схематичным представлением, показывающим точки A510 и A520 входа, заданные для экстентов EXT1[k], и EXT2[k] (буква k представляет целое число, превышающее или равное 0) в файле base A501 и файле DEP A502. Точка A510 входа в файле base A501 задается посредством карты вхождений в файле информации о двумерных клипах, а точка A520 входа в файле DEP A502 задается посредством карты вхождений в файле информации о клипах для воспроизведения зависимого вида. Каждая точка A510 и A520 входа, в частности, включает в себя флаг пары экстентов. Когда точка входа в файле base A501 и точка входа в файле DEP A502 указывают идентичную PTS, "флаг пары экстентов" указывает то, располагаются или нет экстенты, в которых эти точки входа задаются, EXT1[i] и EXT2[j], в одном порядке с начала файлов A501 и A502 (i=j или i≠j). Как показано на фиг. 105, PTS первой точки A530 входа, заданной в (n+1)-м (буква n представляет целое число, превышающее или равное 1) экстенте EXT1[n] для воспроизведения базового вида, равна PTS последней точки A540 входа, заданной в (n-1)-м экстенте EXT2[n-1] для воспроизведения зависимого вида. Соответственно, значение флага пары экстентов для точек A530 и A540 входа задается равным "0". Аналогично, PTS последней точки A531 входа, заданной в (n+1)-м экстенте EXT1[n] для воспроизведения базового вида, равна PTS первой точки A541 входа, заданной в (n+1)-м экстенте EXT2[n+1] для воспроизведения зависимого вида. Соответственно, значение флага пары экстентов для точек A531 и A541 входа задается равным "0". Для других точек A510 and A520 входа, когда PTS являются одинаковыми, порядок экстентов EXT1[•] и EXT2[•], в котором задаются эти точки, также является одинаковым, и тем самым значение флага пары экстентов задается равным "1".
Когда устройство 102 воспроизведения в режиме трехмерного воспроизведения начинает воспроизведение с прерываниями, оно обращается к флагу пары экстентов в точке входа позиции начала воспроизведения. Когда значение флага равно "1", воспроизведение фактически начинается с этой точки входа. Когда значение равно "0", устройство 102 воспроизведения выполняет поиск, до или после этой точки входа, другой точки входа, которая имеет флаг пары экстентов со значением "1". Воспроизведение начинается с этой другой точки входа. Это обеспечивает то, что n-й экстент EXT2[n] для воспроизведения зависимого вида считывается перед n-м экстентом EXT1[n] для воспроизведения базового вида. Как результат, воспроизведение с прерываниями может упрощаться.
Время представления, соответствующее расстоянию между точками входа, имеющими флаг пары экстентов=0, может быть ограничено, чтобы не превышать постоянное число секунд. Например, время может быть ограничено, чтобы быть меньшим или равным значению, в два раза превышающему максимальное значение времени представления для одной GOP. В начале воспроизведения с прерываниями это может сокращать время ожидания, пока воспроизведение не начинается, которое вызывается посредством поиска точки входа, имеющей флаг пары экстентов=1. Альтернативно, значение флага пары экстентов для точки входа после точки входа с флагом пары экстентов=0 может быть ограничено значением "1". Флаг переключения ракурса также может использоваться в качестве замены флага пары экстентов. "Флаг переключения ракурса" - это флаг, подготавливаемый в рамках карты вхождений для содержимого, которое поддерживает многоракурсный режим. Флаг переключения ракурса указывает позицию переключения ракурса в рамках мультиплексированных потоковых данных (см. ниже для описания многоракурсного режима).
<Совпадающие периоды воспроизведения между блоками данных>
Для пар блоков данных с равными ATC-временами экстента период воспроизведения также может совпадать, и время воспроизведения видеопотока может быть равным. Другими словами, число VAU может быть равным между этими блоками данных. Значимость такого равенства поясняется ниже.
Фиг. 106A является схематичным представлением, показывающим путь воспроизведения, когда ATC-времена экстента и времена воспроизведения видеопотока отличаются между смежными блоками данных для воспроизведения базового вида и блоками данных для воспроизведения зависимого вида. Как показано на фиг. 106A, время воспроизведения первого блока B[0] данных для воспроизведения базового вида составляет четыре секунды, а время воспроизведения первого блока D[0] данных для воспроизведения зависимого вида составляет одну секунду. В этом случае, секция видеопотока для воспроизведения базового вида, которая необходима для декодирования блока D[0] данных для воспроизведения зависимого вида, имеет время воспроизведения, идентичное блоку D[0] данных для воспроизведения зависимого вида. Соответственно, чтобы экономить емкость буфера считывания в устройстве 102 воспроизведения, предпочтительно, как показано посредством стрелки ARW1 на фиг. 106A, инструктировать устройству воспроизведения поочередно считывать блок B[0] данных для воспроизведения базового вида и блок D[0] данных для воспроизведения зависимого вида с одинаковым количеством времени воспроизведения, например, по одной секунде за раз. В этом случае, тем не менее, как показано посредством пунктирных линий на фиг. 106A, переходы осуществляются во время обработки считывания. Как результат, трудно инструктировать обработке считывания не отставать от обработки декодирования, и тем самым трудно устойчиво поддерживать плавное воспроизведение.
Фиг. 106B является схематичным представлением, показывающим путь воспроизведения, когда времена воспроизведения видеопотока равны для смежных блоков данных для воспроизведения базового вида и зависимого вида. Как показано на фиг. 106B, время воспроизведения видеопотока между парой смежных блоков данных может быть идентичным. Например, для пары B[0] и D[0] первых блоков данных, времена воспроизведения видеопотока равны одной секунде, а времена воспроизведения видеопотока для второй пары B[1] и D[1] блоков данных равны 0,7 секунде. В этом случае, во время режима трехмерного воспроизведения устройство воспроизведения считывает блоки B[0], D[0], B[1], D[1], ..., данных по порядку с начала, как показано посредством стрелки ARW2 на фиг. 106B. Посредством простого считывания этих блоков данных по порядку, устройство воспроизведения может плавно считывать основной TS и суб-TS поочередно с одинаковыми приращениями во время воспроизведения. В частности, поскольку переход не осуществляется во время обработки считывания, плавное воспроизведение трехмерных видеоизображений может устойчиво поддерживаться.
Если ATC-время экстента фактически является идентичным для смежных блоков данных для воспроизведения базового вида и зависимого вида, переходы не осуществляются во время считывания, и синхронное декодирование может поддерживаться. Соответственно, даже если период воспроизведения или время воспроизведения видеопотока не равны, устройство воспроизведения может надежно поддерживать плавное воспроизведение трехмерных видеоизображений просто посредством считывания групп блоков данных по порядку с начала, как в случае, показанном на фиг. 106B.
Число любых из заголовков в VAU и число PES-заголовков может быть равным для смежных блоков данных для воспроизведения базового вида и зависимого вида. Эти заголовки используются для того, чтобы синхронизировать декодирование между блоками данных. Соответственно, если число заголовков является одинаковым между блоками данных, относительно просто поддерживать синхронное декодирование, даже если число VAU не является одинаковым. Кроме того, в отличие от этого, когда число VAU является одинаковым, все данные в VAU не обязательно должны мультиплексироваться в одном блоке данных. Следовательно, предусмотрена высокая степень свободы для мультиплексирования потоковых данных во время процесса авторинга BD-ROM-диска 101.
Число точек входа может быть равным для смежных блоков данных для воспроизведения базового вида и зависимого вида. Снова ссылаясь на фиг. 105, в файле base A501 и файле DEP A502, экстенты EXT1[n] и EXT2[n], расположенные в одном порядке с начала, имеют идентичное число точек A510 и A520 входа после исключения точек A530, A540, A531, A541 входа с флагом пары экстентов=0. То, присутствуют или нет переходы, различается между режимом двумерного воспроизведения и режимом трехмерного воспроизведения. Когда число точек входа является одинаковым между блоками данных, тем не менее, время воспроизведения является практически одинаковым. Соответственно, просто поддерживать синхронное декодирование независимо от переходов. Кроме того, в отличие от этого, когда число VAU является одинаковым, все данные в VAU не обязательно должны мультиплексироваться в одном блоке данных. Следовательно, предусмотрена высокая степень свободы для мультиплексирования потоковых данных во время процесса авторинга BD-ROM-диска 101.
<Многоракурсный режим>
Фиг. 107A является схематичным представлением, показывающим путь воспроизведения для мультиплексированных потоковых данных, поддерживающих многоракурсный режим. Как показано на фиг. 107A, три типа фрагментов потоковых данных L, R и D, соответственно, для базового вида, вида для просмотра правым глазом и карты глубины мультиплексируются в мультиплексированных потоковых данных. Например, в L/R-режиме фрагменты для просмотра правым глазом и для воспроизведения базового вида потоковых данных L и R воспроизводятся параллельно. Кроме того, фрагменты потоковых данных Ak, Bk и Ck (k=0, 1, 2, ..., n) для различных ракурсов (углов обзора) мультиплексируются в секции, воспроизводимой в течение периода PANG многоракурсного воспроизведения. Потоковые данные Ak, Bk и Ck для различных ракурсов разделяются на секции, для которых время воспроизведения равно интервалу изменения ракурса. Кроме того, потоковые данные для базового вида, вида для просмотра правым глазом и карты глубины мультиплексируются в каждом из фрагментов данных Ak, Bk и Ck. В течение периода PANG многоракурсного воспроизведения воспроизведение может переключаться между фрагментами потоковых данных Ak, Bk и Ck для различных ракурсов в ответ на пользовательскую операцию или инструкцию прикладной программой.
Фиг. 107B является схематичным представлением, показывающим группу A701 блоков данных, записанную на BD-ROM-диске, и соответствующий путь A702 воспроизведения в L/R-режиме. Эта группа A701 блоков данных включает в себя фрагменты потоковых данных L, R, D, Ak, Bk и Ck, показанных на фиг. 107A. Как показано на фиг. 107B, в группе A701 блоков данных, в дополнение к обычным фрагментам потоковых данных L, R и D, фрагменты потоковых данных Ak, Bk и Ck для различных ракурсов записываются в перемеженной компоновке. В L/R-режиме, как показано в пути A702 воспроизведения, блоки R и L для просмотра правым глазом и для воспроизведения базового вида считываются, а считывание блоков D данных карты глубины пропускается посредством переходов. Кроме того, из фрагментов потоковых данных Ak, Bk и Ck для различных ракурсов, блоки данных для выбранных ракурсов A0, B1, ..., Cn считываются, а считывание других блоков данных пропускается посредством переходов.
Фиг. 107C является схематичным представлением, показывающим блок экстентов, сформированный посредством потоковых данных Ak, Bk и Ck для различных ракурсов. Как показано на фиг. 107C, фрагменты потоковых данных Ak, Bk и Ck для каждого ракурса состоят из трех типов блоков L, R и D данных, записанных в перемеженной компоновке. В L/R-режиме, как показано посредством пути A702 воспроизведения, из фрагментов потоковых данных Ak, Bk и Ck для различных ракурсов, блоки R и L для просмотра правым глазом и для воспроизведения базового вида считываются для выбранных ракурсов A0, B1, ..., Cn. В отличие от этого, считывание других блоков данных пропускается посредством переходов.
Следует отметить, что во фрагментах потоковых данных Ak, Bk и Ck для каждого ракурса, потоковые данные для базового вида, вида для просмотра правым глазом и карты глубины могут сохраняться как один фрагмент мультиплексированных потоковых данных. Тем не менее, скорость записи должна быть ограничена диапазоном системной скорости, для которой воспроизведение возможно в устройстве двумерного воспроизведения. Кроме того, число фрагментов потоковых данных (TS), которое должно быть передано в декодер системных целевых объектов, отличается между такими фрагментами мультиплексированных потоковых данных и мультиплексированных потоковых данных для других трехмерных видеоизображений. Соответственно, каждый PI в файле списков для трехмерного воспроизведения может включать в себя флаг, указывающий номер TS, который должен воспроизводиться. Посредством обращения к этому флагу, устройство трехмерного воспроизведения может переключаться между этими фрагментами мультиплексированных потоковых данных в рамках одного файла списков для трехмерного воспроизведения. В PI, который указывает два TS для воспроизведения в режиме трехмерного воспроизведения, этот флаг указывает 2TS. С другой стороны, в PI, который указывает один TS для воспроизведения, к примеру, вышеуказанные фрагменты мультиплексированных потоковых данных, флаг указывает 1TS. Устройство трехмерного воспроизведения может переключать настройку декодера системных целевых объектов в соответствии со значением флага. Кроме того, этот флаг может выражаться посредством значения условия соединения (CC). Например, CC "7" указывает переход от 2TS к 1TS, тогда как CC "8" указывает переход от 1TS к 2TS.
Фиг. 108 является схематичным представлением, показывающим (i) группу A801 блоков данных, составляющих период многоракурсного режима, и (ii) путь A810 воспроизведения в режиме двумерного воспроизведения и путь A820 воспроизведения в L/R-режиме, которые соответствуют группе A801 блоков данных. Как показано на фиг. 108, эта группа A801 блоков данных формируется посредством трех типов секций ANG1 #k, ANG2 #k и ANG3 #k смены ракурса (k=1, 2, ..., 6, 7) в перемеженной компоновке. "Секция смены ракурса" является группой последовательных блоков данных, в которой сохранены потоковые данные для видеоизображений, видимых с одного ракурса. Ракурс видеоизображений отличается между различными типами секций смены ракурса. K-тые секции каждого типа секции ANG1 #k, ANG2 #k и ANG3 #k смены ракурса являются смежными. Каждая секция ANGm #k смены ракурса (m=1, 2, 3) формируется посредством одного блока экстентов, т.е. к ней обращаются как одному экстенту SS EXTSS[k] (k=10, 11, ..., 23). Емкость буфера считывания тем самым может уменьшаться по сравнению с тем, когда множество секций смены ракурса формирует один экстент SS EXTSS[k]. Кроме того, каждый блок экстентов включает в себя один блок R данных для воспроизведения зависимого вида и один блок L данных для воспроизведения базового вида. Эта пара блоков R и L данных упоминается как пара из n-го из экстента EXT2[n] для воспроизведения зависимого вида, и n-го экстента EXT1[n] для воспроизведения базового вида (буква n представляет целое число, превышающее или равное 0).
Размер каждого блока экстентов удовлетворяет условиям 1-4. В частности, переходом, который должен учитываться в условии 1, является переход JANG-2D, чтобы пропускать считывание других секций смены ракурса, как показано посредством пути A810 воспроизведения в режиме двумерного воспроизведения. С другой стороны, переходом, который должен учитываться в условии 4, является переход JANG-LR, чтобы пропускать считывание других секций смены ракурса, как показано посредством пути A820 воспроизведения в L/R-режиме. Как показано посредством путей A810 и A820 воспроизведения, оба этих перехода JANG-2D и JANG-LR, в общем, включают в себя переключатель ракурса, т.е. переключатель между типами секции смены ракурса, которая должна считываться.
Дополнительно ссылаясь на фиг. 108, каждая секция смены ракурса включает в себя один блок L данных для воспроизведения базового вида. Соответственно, ATC-время экстента для экстента EXT1[•] для воспроизведения базового вида ограничено тем, чтобы не превышать максимальное значение TANG длины секции смены ракурса. Например, чтобы давать возможность переключать ракурсы на скорости один раз каждые две секунды времени представления, максимальное значение TANG длины секции смены ракурса должно быть ограничено двумя секундами. Как результат, ATC-время экстента для экстента для воспроизведения базового вида EXT1[•] ограничено двумя секундами или менее. Следовательно, условие 5 изменяется так, что размер SEXT1 экстента для воспроизведения базового вида удовлетворяет выражению 11 вместо выражения 5.
(11)
Следует отметить, что правая сторона выражения 9 может сравниваться вместо правой стороны выражения 5. Кроме того, аналогично расширенному времени ΔT, для ATC-времени экстента для двумерного экстента, показанного в выражении 7A или 7B, максимальное значение TANG длины секции смены ракурса может быть определено посредством длины GOP или верхнего предела числа экстентов, которые могут воспроизводиться в течение предварительно определенного времени. Кроме того, расширенное время ΔT может задаваться равным "0" в многоракурсном режиме.
<Распространение данных через передачу в широковещательном режиме или схему связи>
Носителем записи согласно вариантам осуществления настоящего изобретения может быть, в дополнение к оптическому диску, общий съемный носитель, доступный как коробочный носитель, такой как портативное полупроводниковое запоминающее устройство, включающее в себя карту памяти SD. Кроме того, вышеуказанные варианты осуществления описывают пример оптического диска, на который данные записаны заранее, а именно, общедоступного неперезаписываемого оптического диска, такого как BD-ROM или ROM DVD. Тем не менее, варианты осуществления настоящего изобретения не ограничены таким образом. Например, когда терминал записывает трехмерное видеосодержимое, которое распространено через передачу в широковещательном режиме или сеть, на общедоступный перезаписываемый оптический диск, такой как BD-RE и DVD-RAM, компоновка экстентов согласно варианту осуществления 1 может использоваться. Терминал может быть включен в устройство воспроизведения или может быть устройством, отличным от устройства воспроизведения.
<Воспроизведение полупроводниковой карты памяти>
Далее описывается модуль считывания данных устройства воспроизведения в случае, если полупроводниковая карта памяти используется в качестве носителя записи согласно вариантам осуществления настоящего изобретения вместо оптического диска.
Часть устройства воспроизведения, которая считывает данные с оптического диска, состоит, например, из накопителя на оптических дисках. Наоборот, часть устройства воспроизведения, которая считывает данные из полупроводниковой карты памяти, состоит из собственного интерфейса (I/F). Более подробно, в гнездо для вставки карты предоставляется устройство воспроизведения, и I/F размещается в гнезде для вставки карты. Когда полупроводниковая карта памяти вставляется в гнездо для вставки карты, полупроводниковая карта памяти электрически соединяется с устройством воспроизведения через I/F. Кроме того, данные считываются из полупроводниковой карты памяти в устройство воспроизведения через I/F.
<Технология защиты авторского права для данных, хранимых на BD-ROM-диске>
Далее писан механизм для защиты авторского права на данные, записанные на BD-ROM-диск, в качестве допущения для следующего дополнительного пояснения.
С точки зрения, например, повышения защиты авторского права или конфиденциальности данных, имеются случаи, когда шифруется часть данных, записанных на BD-ROM. Зашифрованные данные - это, например, видеопоток, аудиопоток или другой поток. В таком случае, зашифрованные данные декодируются следующим способом.
Устройство воспроизведения содержит заранее записанную часть данных, необходимых для формирования "ключа", который должен использоваться для декодирования зашифрованных данных, записанных на BD-ROM-диск, а именно, ключа устройства. С другой стороны, BD-ROM-диск содержит записанную другую часть данных, необходимых для формирования "ключа", а именно, ключевой блок носителя данных (MKB) и зашифрованные данные "ключа", а именно, зашифрованный ключ тайтла. Ключ устройства, MKB и зашифрованный ключ тайтла ассоциируются друг с другом, и каждый дополнительно ассоциируется с конкретным идентификатором, записанным в BCA 201A, записанную на BD-ROM-диск 101, показанный на фиг. 2, а именно, с идентификатором тома. Когда комбинация ключа устройства, MKB, зашифрованного ключа тайтла и идентификатора тома является некорректной, зашифрованные данные не могут быть декодированы. Другими словами, только когда комбинация является корректной, вышеуказанный "ключ", а именно, ключ тайтла может быть сформирован. В частности, зашифрованный ключ тайтла сначала дешифруется с использованием ключа устройства, MKB и идентификатора тома. Только когда ключ тайтла может получаться как результат расшифровки, зашифрованные данные могут быть декодированы с использованием ключа тайтла в качестве вышеуказанного "ключа".
Когда устройство воспроизведения пытается воспроизводить зашифрованные данные, записанные на BD-ROM-диск, устройство воспроизведения не может воспроизводить зашифрованные данные, если устройство воспроизведения не имеет сохраненного ключа устройства, который ассоциирован заранее с зашифрованным ключом тайтла, MKB, устройством и идентификатором тома, записанными на BD-ROM-диск. Это обусловлено тем, что ключ, необходимый для декодирования зашифрованных данных, а именно, ключ тайтла может получаться только посредством расшифровки зашифрованного ключа тайтла на основе корректной комбинации MKB, ключа устройства и идентификатора тома.
Чтобы защищать авторское право, по меньшей мере, на одно из видеопотока и аудиопотока, которые должны записываться на BD-ROM-диск, поток, который должен быть защищен, шифруется с использованием ключа тайтла, и зашифрованный поток записывается на BD-ROM-диск. Затем, ключ формируется на основе комбинации MKB, ключа устройства и идентификатора тома, и ключ тайтла шифруется с использованием ключа, который должен быть преобразован в зашифрованный ключ тайтла. Кроме того, MKB, идентификатор тома и зашифрованный ключ тайтла записываются на BD-ROM-диск. Только устройство воспроизведения, сохраняющее ключ устройства, который должен использоваться для формирования вышеуказанного ключа, может декодировать зашифрованный видеопоток и/или зашифрованный аудиопоток, записанный на BD-ROM-диск, с использованием декодера. Таким образом, можно защищать авторское право на данные, записанные на BD-ROM-диск.
Вышеописанный механизм для защиты авторского права на данные, записанные на BD-ROM-диск, применим к носителю записи, отличному из BD-ROM-диска. Например, механизм применим к читаемому и перезаписываемому полупроводниковому запоминающему устройству и, в частности, к портативной полупроводниковой карте памяти, такой как SD-карта.
<Запись данных на носитель записи через электронное распространение>
Далее описывается обработка, чтобы передавать данные, к примеру, файл AV-потока для трехмерного видео (в дальнейшем в этом документе, "распространяемые данные) в устройство воспроизведения согласно вариантам осуществления настоящего изобретения через электронное распространение и инструктировать устройству воспроизведения записывать распространяемые данные в полупроводниковую карту памяти. Следует отметить, что следующие операции могут выполняться посредством специализированного терминала для выполнения обработки вместо вышеуказанного устройства воспроизведения. Кроме того, последующее описание основано на допущении, что полупроводниковой картой памяти, которая является назначением записи, является карта памяти SD.
Устройство воспроизведения включает в себя вышеописанное гнездо для вставки карты. Карта памяти SD вставляется в гнездо для вставки карты. Устройство воспроизведения в этом состоянии сначала передает запрос на передачу распространяемых данных на сервер распространения в сети. Здесь, устройство воспроизведения считывает идентификационную информацию карты памяти SD из карты памяти SD и передает идентификационную информацию считывания на сервер распространения вместе с запросом на передачу. Идентификационная информация карты памяти SD - это, например, идентификационный номер, конкретный для карты памяти SD, а более конкретно, порядковый номер карты памяти SD. Идентификационная информация используется в качестве вышеописанного идентификатора тома.
Сервер распространения имеет сохраненные фрагменты распространяемых данных. Распространяемые данные, которые должны защищаться посредством шифрования, такие как видеопоток и/или аудиопоток, зашифрованы с использованием предварительно определенного ключа тайтла. Зашифрованные распространяемые данные могут дешифроваться с использованием этого ключа тайтла.
Сервер распространения сохраняет ключ устройства как закрытый ключ, общий с устройством воспроизведения. Сервер распространения дополнительно сохраняет MKB, общий с картой памяти SD. После приема запроса на передачу распространяемых данных и идентификационной информации карты памяти SD из устройства воспроизведения, сервер распространения сначала формирует ключ из ключа устройства, MKB и идентификационной информации и шифрует ключ тайтла с использованием сформированного ключа, чтобы формировать зашифрованный ключ тайтла.
Затем, сервер распространения формирует информацию открытого ключа. Информация открытого ключа включает в себя, например, MKB, зашифрованный ключ тайтла, информацию подписи, идентификационный номер карты памяти SD и список устройств. Информация подписи включает в себя, например, хэш-значение информации открытого ключа. Список устройств - это список устройств, которые должны признаваться недействительными, т.е. устройств, которые имеют риск осуществления неавторизованного воспроизведения зашифрованных данных, включенных в распространяемые данные. Список устройств указывает ключ устройства и идентификационный номер для устройства воспроизведения, а также идентификационный номер или функцию (программу) для каждого элемента в устройстве воспроизведения, таком как декодер.
Сервер распространения передает распространяемые данные и информацию открытого ключа в устройство воспроизведения. Устройство воспроизведения принимает распространяемые данные и информацию открытого ключа и записывает их на карту памяти в формате SD через собственный интерфейс гнезда для вставки карты.
Зашифрованные распространяемые данные, записанные на карте памяти SD, дешифруются с использованием информации открытого ключа, например, следующим способом. Сначала, три типа проверок выполняются в качестве аутентификации информации открытого ключа. Эти проверки могут выполняться в любом порядке.
(1) Идентификационная информация карты памяти в формате SD, включенная в информацию открытого ключа, совпадает с идентификационным номером, сохраненным в карте памяти в формате SD, вставленной в гнездо для вставки карты?
(2) Хэш-значение, вычисляемое на основе информации открытого ключа, совпадает с хэш-значением, включенным в информацию подписи?
(3) Устройство воспроизведения, исключенное из списка устройств, указывается посредством информации открытого ключа? Конкретно, ключ устройства для устройства воспроизведения исключен из списка устройств?
Если, по меньшей мере, любой из результатов проверок (1)-(3) является отрицательным, устройство воспроизведения прекращает обработку расшифровки зашифрованных данных. В отличие от этого, если все результаты проверок (1)-(3) являются положительными, устройство воспроизведения авторизует информацию открытого ключа и расшифровывает зашифрованный ключ тайтла, включенный в информацию открытого ключа, с использованием ключа устройства, MKB и идентификационной информации карты памяти SD, чтобы тем самым получать ключ тайтла. Устройство воспроизведения дополнительно расшифровывает зашифрованные данные, например, с использованием ключа тайтла, тем самым получая, например, видеопоток и/или аудиопоток.
Вышеозначенный механизм имеет следующее преимущество. Если устройство воспроизведения, структурные элементы и функция (программа), которые имеют риск использования неавторизованным способом, уже известны, когда данные передаются через электронное распространение, соответствующие фрагменты идентификационной информации перечисляются в списке устройств и распространяются как часть информации открытого ключа. С другой стороны, устройство воспроизведения, которое запрашивает распространяемые данные, неизбежно должно сравнивать фрагменты идентификационной информации, включенной в список устройств, с фрагментами идентификационной информации устройства воспроизведения, его структурных элементов и т.п. Как результат, если устройство воспроизведения, его структурные элементы и т.п. идентифицированы в списке устройств, устройство воспроизведения не может использовать информацию открытого ключа для расшифровывания зашифрованных данных, включенных в распространяемые данные, даже если комбинация идентификационного номера карты памяти SD, MKB, зашифрованного ключа тайтла и ключа устройства является корректной. Таким образом, можно эффективно не допускать неавторизованного использования распространяемых данных.
Идентификационная информация полупроводниковой карты памяти предпочтительно записывается в область записи, имеющую высокую конфиденциальность, включенную в область записи полупроводниковой карты памяти. Это обусловлено тем, что если идентификационная информация, такая как порядковый номер карты памяти SD, неавторизованно имитирована, можно легко реализовывать недопустимую копию карты памяти SD. Другими словами, если несанкционированное изменение дает возможность формирования множества полупроводниковых карт памяти, имеющих одинаковую идентификационную информацию, невозможно идентифицировать авторизованные продукты и продукты неавторизованного копирования посредством выполнения вышеуказанной проверки (1). Следовательно, необходимо записывать идентификационную информацию полупроводниковой карты памяти в области записи высокой конфиденциальности, чтобы защищать идентификационную информацию от неавторизованной имитации.
Области записи высокой конфиденциальности создается, например, в рамках полупроводниковой карты памяти следующим способом. Прежде всего, в качестве области записи, электрически отсоединенной от области записи для записи обычных данных (в дальнейшем в этом документе, "первой области записи"), предоставляется другая область записи (в дальнейшем в этом документе, "вторая область записи"). Затем, схема управления исключительно для осуществления доступа ко второй области записи предоставляется в рамках полупроводниковой карты памяти. Как результат, доступ ко второй области записи может выполняться только через схему управления. Например, допустим, что только зашифрованные данные записаны во второй области записи, и схема для расшифровки зашифрованных данных включена только в схему управления. Как результат, доступ к данным, записанным во второй области записи, может выполняться только посредством инструктирования схеме управления сохранять адрес каждого фрагмента данных, записанного во вторую область записи. Кроме того, адрес каждого фрагмента данных, записанного во второй области записи, может сохраняться только в схеме управления. В этом случае, только схема управления может идентифицировать адрес каждого фрагмента данных, записанного во второй области записи.
В случае, если идентификационная информация полупроводниковой карты памяти записывается во второй области записи, то когда прикладная программа, работающая в устройстве воспроизведения, обнаруживает данные из сервера распространения через электронное распространение и записывает обнаруженные данные в полупроводниковую карту памяти, следующая обработка выполняется. Прежде всего, прикладная программа выдает запрос на доступ в схему управления через I/F карты памяти для осуществления доступа к идентификационной информации полупроводниковой карты памяти, записанной во второй области записи. В ответ на запрос на доступ схема управления сначала считывает идентификационную информацию из второй области записи. Затем, схема управления передает идентификационную информацию в прикладную программу через I/F карты памяти. Прикладная программа передает запрос на передачу распространяемых данных вместе с идентификационной информацией. Прикладная программа дополнительно записывает, в первой области записи полупроводниковой карты памяти через I/F карты памяти, информацию открытого ключа и распространяемые данные, принимаемые из сервера распространения, в ответ на запрос на передачу.
Следует отметить, что предпочтительно, чтобы вышеописанная прикладная программа проверяла, внесены или нет несанкционированные изменения в саму прикладную программу, перед выдачей запроса на доступ к схеме управления полупроводниковой карты памяти. Проверка может выполняться с использованием цифрового сертификата, совместимого со стандартом X509. Кроме того, необходимо записывать только распространяемые данные в первую область записи полупроводниковой карты памяти, как описано выше. Доступ к распространяемым данным может не управляться посредством схемы управления полупроводниковой карты памяти.
<Применение для записи в реальном времени>
Вариант осуществления 4 основан на допущении, что файл AV-потока и файл списков воспроизведения записаны на BD-ROM-диск с использованием технологии предварительной записи системы поддержки авторских разработок, и записанный файл AV-потока и файл списков воспроизведения предоставляются пользователям. Альтернативно, может быть возможным записывать, посредством выполнения записи в реальном времени, файл AV-потока и файл списков воспроизведения на перезаписываемый носитель записи, такой как BD-RE-диск, BD-R-диск, жесткий диск и полупроводниковая карта памяти (в дальнейшем в этом документе, "BD-RE-диск и т.п.") и предоставлять пользователю записанный файл AV-потока и файл списков воспроизведения. В таком случае, файл AV-потока может быть транспортным потоком, который получен в результате декодирования в реальном времени аналогового входного сигнала, выполняемого посредством записывающего устройства. Альтернативно, файл AV-потока может быть транспортным потоком, полученным в результате дифференциации транспортного потока в цифровой форме, вводимого посредством записывающего устройства.
Записывающее устройство, выполняющее запись в реальном времени, включает в себя видеокодер, аудиокодер, мультиплексор и модуль пакетирования источников. Видеокодер кодирует видеосигнал, чтобы преобразовывать его в видеопоток. Аудиокодер кодирует аудиосигнал, чтобы преобразовывать его в аудиопоток. Мультиплексор мультиплексирует видеопоток и аудиопоток, чтобы преобразовывать их в цифровой поток в формате MPEG-2 TS. Модуль пакетирования источников преобразует TS-пакеты в цифровом потоке в формате MPEG-2 TS в исходные пакеты. Записывающее устройство сохраняет каждый исходный пакет в файле AV-потока и записывает файл AV-потока на BD-RE-диске и т.п.
Параллельно с обработкой записи файла AV-потока, модуль управления записывающего устройства формирует файл информации о клипах и файл списков воспроизведения в запоминающем устройстве и записывает файлы на BD-RE-диск и т.п. В частности, когда пользователь запрашивает выполнение записи обработки, модуль управления сначала формирует файл информации о клипах в соответствии с файлом AV-потока и записывает файл на BD-RE-диск и т.п. В таком случае, каждый раз, когда заголовок GOP видеопотока обнаруживается из транспортного потока, принимаемого извне, или каждый раз, когда GOP видеопотока формируется посредством видеокодера, модуль управления обнаруживает PTS I-изображения, размещаемого в заголовке GOP, и SPN исходного пакета, в котором сохраняется заголовок GOP. Модуль управления дополнительно сохраняет пару PTS и SPN как одну точку входа в карте вхождений файла информации о клипах. В это время, флаг "is_angle_change" добавляется к точке входа. Флаг is_angle_change помечается, когда заголовок GOP является IDR-изображением, и снимается, когда заголовок GOP не является IDR-изображением. В файле информации о клипах информация атрибутов потока дополнительно задается в соответствии с атрибутом потока, который должен быть записан. Таким образом, после записи файла AV-потока и файла информации о клипах на BD-RE-диск и т.п., модуль управления формирует файл списков воспроизведения с использованием карты вхождений в файле информации о клипах и записывает файл на BD-RE-диск и т.п.
<Управляемое копирование>
Устройство воспроизведения согласно вариантам осуществления настоящего изобретения может записывать цифровой поток, записанный на BD-ROM-диск 101, на другой носитель записи через управляемое копирование. "Управляемое копирование" означает технологию для разрешения копирования цифрового потока, файла списков воспроизведения, файла информации о клипах и прикладной программы с неперезаписываемого носителя записи, такого как BD-ROM-диск, на перезаписываемый носитель записи только в случае, если аутентификация через обмен данными с сервером выполнена успешно. Этот перезаписываемый носитель записи может быть перезаписываемым оптическим диском, таким как BD-R, BD-RE, DVD-R, DVD-RW или DVD-RAM, жестким диском или портативным полупроводниковым запоминающим элементом, таким как карта памяти в формате SD, Memory Stick™, Compact Flash™, Smart Media™ или Multimedia Card™. Управляемое копирование предоставляет возможность ограничения числа резервных копий данных, записанных на неперезаписываемый носитель записи, и взимания платы за резервные копии.
Когда управляемое копирование выполняется из BD-ROM-диска на BD-R-диск или BD-RE-диск, и два диска имеют эквивалентную емкость записи, потоки битов, записанные на исходном диске, могут быть скопированы по порядку, как есть.
Если управляемое копирование выполняется между различными типами носителей записи, транскодирование должно выполняться. Это "транскодирование" означает обработку для регулирования цифрового потока, записанного на исходном диске, в формат приложения носителя записи, который является назначением копии. Например, транскодирование включает в себя процесс преобразования формата MPEG-2 TS в формат программного потока MPEG-2 и процесс уменьшения скорости передачи битов каждого видеопотока и аудиопотока и повторного кодирования видеопотока и аудиопотока. В ходе выполнения транскодирования, файл AV-потока, файл информации о клипах и файл списков воспроизведения должны быть сформированы при вышеописанной записи в реальном времени.
<Способ для описания структуры данных>
Из структур данных в вариантах осуществления настоящего изобретения повторная структура "имеется множество фрагментов информации, имеющих предварительно определенный тип", задается посредством описания начального значения управляющей переменной и циклического условия в предложении "for". Кроме того, структура данных "если предварительно определенное условие удовлетворяется, предварительно определенная информация задается", задается посредством описания, в предложении "if", условия и переменной, которая должна задаваться в момент, когда условие удовлетворяется. Таким образом, структура данных, описанная в вариантах осуществления, описывается с использованием высокоуровневого языка программирования. Соответственно, структура данных преобразуется посредством компьютера в машиночитаемый код через процесс трансляции, выполняемый посредством компилятора, который включает в себя "синтаксический анализ", "оптимизацию", "выделение ресурсов" и "генерацию кода", и структура данных затем записывается на носитель записи. Посредством описания на высокоуровневом языке программирования, структура данных обрабатывается как часть, отличная от метода структуры классов на объектно-ориентированном языке, а именно как переменная экземпляра типа массив структуры классов, и составляет часть программы. Другими словами, структура данных практически эквивалентна программе. Следовательно, структура данных должна защищаться как компьютерное изобретение.
<Управление файлом списков воспроизведения и файлом информации о клипах посредством программы воспроизведения>
Когда файл списков воспроизведения и файл AV-потока записываются на носитель записи, программа воспроизведения записывается на носитель записи в формате исполняемых файлов. Программа воспроизведения инструктирует компьютеру воспроизводить файл AV-потока в соответствии с файлом списков воспроизведения. Программа воспроизведения загружается из носителя записи в запоминающий элемент компьютера и затем выполняется посредством компьютера. Процесс загрузки включает в себя обработку компилирования или обработку связывания. Посредством этих процессов программа воспроизведения разделяется на множество секций в запоминающем элементе. Секции включают в себя текстовую секцию, секцию данных, bss-секцию и секцию стека. Текстовая секция включает в себя кодовый массив программы воспроизведения, начального значения и неперезаписываемых данных. Секция данных включает в себя переменные с начальными значениями и перезаписываемые данные. В частности, секция данных включает в себя файл, который записан на носитель записи и доступ к которому может осуществляться в любое время. Bss-секция включает в себя переменные, не имеющие начального значения. К данным, включенным в bss-секцию, обращаются в ответ на команды, указанные посредством кода в текстовой секции. Во время обработки компилирования или обработки связывания, область для bss-секции выделяется во внутреннем RAM компьютера. Секция стека - это область запоминающего устройства, временно выделенная по мере необходимости. Во время каждого из процессов посредством программы воспроизведения временно используются локальные переменные. Секция стека включает в себя эти локальные переменные. Когда программа выполняется, переменные в bss-секции первоначально задаются в нуле, и необходимая область запоминающего устройства выделяется в секции стека.
Как описано выше, файл списков воспроизведения и файл информации о клипах уже преобразованы на носителе записи в машиночитаемый код. Соответственно, во время выполнения программы воспроизведения, эти файлы управляются как "неперезаписываемые данные" в текстовой секции или как "файл, доступ к которому осуществляется в любое время" в секции данных. Другими словами, файл списков воспроизведения и файл информации о клипах включаются как структурный элемент программы воспроизведения во время выполнения. Следовательно, файл списков воспроизведения и файл информации о клипах выполняют более существенную роль в программе воспроизведения, чем простое представление данных.
Промышленная применимость
Настоящее изобретение относится к технологии для воспроизведения стереоскопического видео и, как описано выше, предоставляет возможность идентификации TS-пакетов с использованием флага TS-приоритета. Следовательно, очевидно, что настоящее изобретение применимо в промышленном масштабе.
Список номеров ссылок
1500 - VAU #1 в видеопотоке для воспроизведения зависимого вида
1510 - PES-пакет
1512 - рабочие PES-данные
1520 - последовательность TS-пакетов
1521 - первая группа последовательности 1520 TS-пакетов
1522 - вторая группа последовательности 1520 TS-пакетов
1523 - третья группа последовательности 1520 TS-пакетов
1530 - TS-пакет, расположенный в конце первой группы 1521
1531 - TS-заголовок TS-пакета 1530
1532 - AD-поле TS-пакета 1530
1533 - рабочие TS-данные TS-пакета 1530
1540 - TS-пакет, принадлежащий второй группе 1522
1541 - TS-заголовок TS-пакета 1540
1542 - рабочие TS-данные TS-пакета 1540
1550 - TS-пакет, расположенный в конце второй группы 1522
1551 - TS-заголовок TS-пакета 1550
1552 - AD-поле TS-пакета 1550
1553 - рабочие TS-данные TS-пакета 1550
1560 - TS-пакет, принадлежащий третьей группе 1523
1561 - TS-заголовок TS-пакета 1560
1562 - рабочие TS-данные TS-пакета 1560
Изобретение относится к средствам воспроизведения стереоскопического изображения с носителя записи. Техническим результатом является обеспечение извлечения информации смещения из информации видеопотока. Устройство содержит модуль считывания потоковых данных с носителя записи, модуль декодирования потоковых данных; модуль фильтра TS-приоритетов; процессор метаданных, модуль комбинирования плоскости. В устройстве видеопоток основного вида, видеопоток подвида и графический поток записываются на носитель записи, видеопоток основного вида включает изображения основного вида, видеопоток подвида включает изображения подвида и метаданные, графический поток включает в себя графические данные моноскопического изображения. 6 н. и 3 з.п. ф-лы, 123 ил.
1. Устройство воспроизведения для воспроизведения видеоизображений с носителя записи, в котором:
видеопоток основного вида, видеопоток подвида и графический поток записываются на носитель записи,
видеопоток основного вида включает в себя изображения основного вида, составляющие основные виды стереоскопических видеоизображений,
видеопоток подвида включает в себя изображения подвида и метаданные, причем изображения подвида составляют подвиды стереоскопических видеоизображений,
графический поток включает в себя графические данные, составляющие моноскопические графические изображения,
изображения основного вида, каждое, визуализируются на видеоплоскости основного вида при воспроизведении,
изображения подвида, каждое, визуализируются на видеоплоскости подвида при воспроизведении,
графические данные визуализируются на графической плоскости при воспроизведении,
метаданные предоставляются в каждой группе изображений (GOP), составляющей видеопоток подвида, и включают в себя информацию смещения,
информация смещения является управляющей информацией, определяющей управление смещением,
управление смещением является процессом для обеспечения смещения влево и смещения вправо для горизонтальных координат в графической плоскости, чтобы формировать пару графических плоскостей, и затем комбинирования пары графических плоскостей отдельно с видеоплоскостью основного вида и видеоплоскостью подвида,
видеопоток подвида мультиплексируется в транспортном потоке (TS),
TS-пакеты, составляющие TS, каждый, имеют заголовок, включающий в себя флаг TS-приоритета, указывающий приоритет TS-пакета, и TS-пакеты, содержащие метаданные, каждый, имеют значение флага TS-приоритета, отличное от TS-пакетов, содержащих изображения подвида,
при этом устройство воспроизведения содержит:
модуль считывания, выполненный с возможностью считывать потоковые данные с носителя записи;
модуль декодирования, выполненный с возможностью декодировать потоковые данные, считываемые посредством модуля считывания, по меньшей мере, в любую из видеоплоскостей и графических плоскостей;
модуль фильтра TS-приоритетов, выполненный с возможностью отслеживать флаги TS-приоритета TS-пакетов, включенных в потоковые данные, и извлекать TS-пакеты, содержащие метаданные;
процессор метаданных, выполненный с возможностью извлекать метаданные из TS-пакетов, извлеченных посредством модуля фильтра TS-приоритетов; и
модуль комбинирования плоскости, выполненный с возможностью выполнять управление смещением на графической плоскости в соответствии с информацией смещения, включенной в метаданные, извлеченные посредством процессора метаданных.
2. Устройство воспроизведения по п.1, в котором модуль декодирования декодирует TS-пакеты, которые не извлечены посредством модуля фильтра TS-приоритета.
3. Способ записи видеопотока и графического потока на носитель записи, содержащий этапы на которых:
формируют видеопоток основного вида, который включает в себя изображения основного вида, составляющие основные виды стереоскопических видеоизображений,
формируют видеопоток подвида, который включает в себя изображения подвида и метаданные, причем изображения подвида составляют подвиды стереоскопических видеоизображений,
формируют графический поток, который включает в себя графические данные, составляющие моноскопические графические изображения,
записывают видеопоток основного вида на носитель записи,
записывают видеопоток подвида на носитель записи и
записывают графический поток на носитель записи, причем
изображения основного вида, каждое, визуализируются на видеоплоскости основного вида при воспроизведении,
изображения подвида, каждое, визуализируются на видеоплоскости подвида при воспроизведении,
графические данные визуализируются на графической плоскости при воспроизведении,
метаданные предоставляются в каждой группе изображений (GOP), составляющей видеопоток подвида, и включают в себя информацию смещения,
информация смещения является управляющей информацией, определяющей управление смещением,
управление смещением является процессом для обеспечения смещения влево и смещения вправо для горизонтальных координат в графической плоскости, чтобы формировать пару графических плоскостей, и затем комбинирования пары графических плоскостей отдельно с видеоплоскостью основного вида и видеоплоскостью подвида,
видеопоток подвида мультиплексируется в транспортном потоке (TS),
TS-пакеты, составляющие TS, каждый, имеют заголовок, включающий в себя флаг TS-приоритета, указывающий приоритет TS-пакета, и
TS-пакеты, содержащие метаданные, каждый, имеют значение флага TS-приоритета, отличное от TS-пакетов, содержащих изображения подвида.
4. Система, содержащая носитель записи и устройство воспроизведения для воспроизведения видеоизображений с носителя записи, в которой
видеопоток основного вида, видеопоток подвида и графический поток записываются на носитель записи,
видеопоток основного вида включает в себя изображения основного вида, составляющие основные виды стереоскопических видеоизображений,
видеопоток подвида включает в себя изображения подвида и метаданные, причем изображения подвида составляют подвиды стереоскопических видеоизображений,
графический поток включает в себя графические данные, составляющие моноскопические графические изображения,
изображения основного вида, каждое, визуализируются на видеоплоскости основного вида при воспроизведении,
изображения подвида, каждое, визуализируются на видеоплоскости подвида при воспроизведении,
графические данные визуализируются на графической плоскости при воспроизведении,
метаданные предоставляются в каждой группе изображений (GOP), составляющей видеопоток подвида, и включают в себя информацию смещения,
информация смещения является управляющей информацией, указывающей управление смещением,
управление смещением является процессом для обеспечения смещения влево и смещения вправо для горизонтальных координат в графической плоскости, чтобы формировать пару графических плоскостей, и затем комбинирования пары графических плоскостей отдельно с видеоплоскостью основного вида и видеоплоскостью подвида,
видеопоток для воспроизведения подвида мультиплексируется в транспортном потоке (TS),
TS-пакеты, составляющие TS, каждый, имеют заголовок, включающий в себя флаг TS-приоритета, указывающий приоритет TS-пакета, и
TS-пакеты, содержащие метаданные, имеют значение флага TS-приоритета, отличное от TS-пакетов, содержащих изображения подвида,
при этом устройство воспроизведения содержит:
модуль считывания, выполненный с возможностью считывать потоковые данные с носителя записи;
модуль декодирования, выполненный с возможностью декодировать потоковые данные, считываемые посредством модуля считывания, по меньшей мере, в любую из видеоплоскостей и графических плоскостей;
модуль фильтра TS-приоритетов, выполненный с возможностью отслеживать флаги TS-приоритета TS-пакетов, включенных в потоковые данные, и извлекать TS-пакеты, содержащие метаданные;
процессор метаданных, выполненный с возможностью извлекать метаданные из TS-пакетов, извлеченных посредством модуля фильтра TS-приоритетов; и
модуль комбинирования плоскостей, выполненный с возможностью выполнять управление смещением на графической плоскости в соответствии с информацией смещения, включенной в метаданные, извлеченные посредством процессора метаданных.
5. Непереходный носитель записи, содержащий:
видеопоток основного вида, используемый для обеспечения множества изображений основного вида из множества стереоскопических видеоизображений, причем декодированный видеопоток основного вида представляется на видеоплоскости основного вида;
видеопоток подвида, используемый для обеспечения множества подвидов множества стереоскопических видеоизображений, причем декодированный видеопоток подвида представляется на видеоплоскости подвида; и
графический поток, используемый для обеспечения множества графических изображений, причем декодированный графический поток представляется на графической плоскости,
причем видеопоток подвида мультиплексируется в транспортный поток,
причем множество транспортных пакетов формируется из транспортного потока,
причем каждый из множества транспортных пакетов имеет информацию, указывающую, содержит ли транспортный пакет информацию смещения,
причем видеопоток подвида включает в себя информацию смещения,
причем первая сдвинутая графическая плоскость и вторая сдвинутая графическая плоскость сформированы основанными на графической плоскости, на которой представлен декодированный графический поток и информация смещения,
причем данные, сформированные из видеоплоскости основного вида, на которой декодированный видеопоток основного вида представлен, и данные, сформированные из первой сдвинутой графической плоскости, накладываются, и
причем данные, сформированные из видеоплоскости подвида, на которой представлен видеопоток, и данные, сформированные из второй сдвинутой графической плоскости, накладываются.
6. Непереходный носитель записи по п.5, в котором видеопоток подвида имеет множество групп изображений, причем информация смещения обеспечена в каждой из множества групп изображений.
7. Непереходный носитель записи по п.5, в котором информация смещения включает в себя флаг, указывающий направление горизонтального сдвига ассоциированной графической плоскости.
8. Способ воспроизведения непереходного носителя записи по п.5, причем способ воспроизведения содержит этапы:
считывания видеопотока основного вида, видеопотока подвида и графического потока с непереходного носителя записи;
представления декодированного видеопотока основного вида на видеоплоскость основного вида;
представления декодированного видеопотока подвида на видеоплоскость подвида;
представления декодированного графического потока на графическую плоскость;
обеспечения первой сдвинутой графической плоскости и второй сдвинутой графической плоскости на основании графической плоскости, на которой представлено графическое изображение и информация смещения.
9. Способ записи, содержащий этапы:
формирования видеопотока основного вида, используемого для обеспечения множества изображений основного вида из множества стереоскопических видеоизображений, причем декодированный видеопоток основного вида представляется на видеоплоскости основного вида,
формирования видеопотока подвида, используемого для обеспечения множества подвидов множества стереоскопических видеоизображений, причем декодированный видеопоток подвида представляется на видеоплоскости подвида;
формирования графического потока, используемого для обеспечения множества графических изображений, причем декодированный графический поток представляется на графической плоскости; и
записи сформированного видеопотока основного вида, сформированного видеопотока подвида и сформированного графического потока на непереходный носитель записи,
причем видеопоток подвида мультиплексирован в транспортный поток,
причем множество транспортных пакетов формируется из транспортного потока,
причем каждый из множества транспортных пакетов имеет информацию, указывающую, содержит ли транспортный пакет информацию смещения,
причем видеопоток подвида включает в себя информацию смещения,
причем первая сдвинутая графическая плоскость и вторая сдвинутая графическая плоскость образованы на основании графической плоскости, на которой представлен декодированный графический поток и информация смещения,
причем данные, образованные из видеоплоскости основного вида, на которой декодированный видеопоток основного вида представлен, и данные, образованные из первой сдвинутой графической плоскости, накладываются, и
причем данные, образованные из видеоплоскости подвида, на которой представлен видеопоток, и данные, образованные из второй сдвинутой графической плоскости, накладываются.
US 6573819 B1, 03.06.2003 | |||
WO 2008044191 A2, 17.04.2008 | |||
EP 1873775 A1, 02.01.2008 | |||
US 20090041339 A1, 12.02.2009 | |||
СПОСОБ ПЕРЕДАЧИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ | 2003 |
|
RU2282946C2 |
НОСИТЕЛЬ ДАННЫХ, ХРАНЯЩИЙ ПОТОК ИНТЕРАКТИВНОЙ ГРАФИКИ, А ТАКЖЕ УСТРОЙСТВО И СПОСОБ ВОСПРОИЗВЕДЕНИЯ | 2005 |
|
RU2353984C2 |
Авторы
Даты
2015-02-10—Публикация
2010-07-07—Подача