Dzielenie tekstu na sylaby -- dowolna technologia

News group pl.comp.www.server-side

Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 04:08
Pytałem już o to wielokrotnie na różnych forach i zupełnie nie rozumiem,
dlaczego za każdym razem pytanie to pozostawało bez odpowiedzi. Więc
spróbuję tutaj i teraz:

Poszukuję sposobu na dzielenie plików XML/HTML na sylaby według zasad danego
języka, celem uzyskania na stroniw WWW estetycznego składu wyrównanego do
obu marginesów.

Technicznie efekt taki można uzyskać w Internet Explorerze wstawiając encję
­ w miejsce znaku proponowanego podziału. Interesuje mnie wersja
działająca w ten właśnie sposób (osobna wersja stron dla Netscape byłaby
pozbawiona tej funkcji).

Przykładowa strona złożona w ten sposób mogłaby wyglądać tak:
http://193.174.120.13/twardoch/f/pl/font/sparing/sparing_ie.html
(proszę zajrzeć w kod).

Narzędzie to miałoby dokonywać transformacji automatycznie, najlepiej z
uwzględnieniem reguł odpowiednich dla różnych języków, w zależności od
atrybutu LANG fragmentu tekstu, który akurat jest przetwarzany. Technologia
dowolna: ASP, PHP, Java.

Czy ktoś miał już jakieś doświadczenia z czymś takim? Lub ma pomysł, jak
możnaby coś takiego napisać (gdzie najlepiej szukać źródeł językowych).
Menu
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 11:02
>Lub ma pomysł, jak
>możnaby coś takiego napisać (gdzie najlepiej szukać źródeł językowych).

jedyne znane mi źródło darmowych i (stosunkowo) łatwych do obrobienia
zasad przenoszenia wyrazów (czyli de facto podziału na sylaby) zawiera
tex (vide ftp://ftp.gust.org.pl/TeX/language/polish/plhyph.tex)

teraz pozostaje ci zrozumieć w jaki sposób tex wykorzystuje ten plik (;
-- rtfs i pytaj na pl.comp.dtp.tex & pcdt.gust

przeme2K
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 20:02
>>Lub ma pomysł, jak
>>możnaby coś takiego napisać (gdzie najlepiej szukać źródeł językowych).
>
>jedyne znane mi źródło darmowych i (stosunkowo) łatwych do obrobienia
>zasad przenoszenia wyrazów (czyli de facto podziału na sylaby) zawiera
>tex (vide ftp://ftp.gust.org.pl/TeX/language/polish/plhyph.tex)

No wiem. Sam jestem członkiem GUST :)

Jakoś nikt mi tam nie chciał pomóc, ale jeszcze raz spróbuję...

Jak pisałem, optymalne byłoby, gdybym mógł wykorzystać algorytmy dla RÓŻNYCH
języków...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 12:35
>Technicznie efekt taki można uzyskać w Internet Explorerze wstawiając
encję

...ale po co? nie moge skumac po co tak komplikowac zycie?? Z tego co widze
czcionka nie jest monospace wiec czy nie wystarczy zwykly podzial na koncu
slowa i wyjustowanie? Do tego powiedzmy ze na kazde slowo przypadaja dwa
razy $shy czyli 4 znaki... razy ilosc slow... ta strona bedzie wazyc wiecej
niz prezentacja we flashu... nie qmam po co.

PS: no ale ja sie nie znam
pozdro
Lejzik
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 20:01
>...ale po co? nie moge skumac po co tak komplikowac zycie?? Z tego co
widze
>czcionka nie jest monospace wiec czy nie wystarczy zwykly podzial na koncu
>slowa i wyjustowanie?

Pytanie pomocnicze: jak myślisz, po co stosuje się przenoszenie wyrazów w
gazetach, książkach?

Rozmiar tekstu akurat w moim przypadku nie ma znaczenia (nie jest
priorytetem).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 21:00
huh... ciekawy wątek, choć wydaje mi się, Adamie, że gdyby coś takiego
zostało stworzone (otwarty standard definiowania zasad dzielenia wyrazów),
oraz miałoby to API chociażby dla C, zrewolucjonizowałoby to całe
dotychczasowe DTP - po co zatrudniać 'elektronicznych zecerów' używających
Quark'a razem z Gwarkiem, skoro można tak skonfigurować system firmy, że
dziennikarze dostarczaliby tekstów, maszyna by robiła całą resztę? -- odrazu
ludzie, którzy zajmują się składem gazet wylecieliby z krzesełek :))).

I oni dbają o to, żeby jeszcze dłuuuugo nie było takiego standardu. IMVHO
oczywiście :)

Składanie gazet z drugiej strony jest nie tylko dbaniem o tekst, ale i
kilkoma innymi sprawami - umieszczaniem reklam, jeszcze zostaje coś takiego
jak 'wyczucie' :))))... ale... to już łatwiej się ominie - makro
umieszczające reklamy na podstawie ich kolorów i wielkości, makro
rozmieszczające tytuły wg. konkretnych reguł...

...WOW! -- samemu mi się w to nie chce wierzyć...
...a jednak - Ja to powiedziałem!!!

// leming nine, yellowtree and fourth studio
// http://fourth-studio.design.prv.pl/
// PS: no i FUT z tym na pl.comp.dtp :))))
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 09:41
[ Adam Twardoch ]
[...]
>Czy ktoś miał już jakieś doświadczenia z czymś takim? Lub ma pomysł, jak
>możnaby coś takiego napisać (gdzie najlepiej szukać źródeł językowych).

A przepraszam, pytasz o algorytm dzielenia na wyrazy, czy o parsowanie
pliku XML w celu wydobycia fragmentów tekstu?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 20:56
[ o dzieleniu wyrazow ]

A nie lepiej zostawic to przyszym wersjom przegladarek i ograniczyc sie do
definiowania jezyka?

Poza tym przy kopiowaniu takiego tesktu do schowka, OE wstawia znak "-" w
miejsce ­. Domyslasz sie zatem jaki jest efekt przy wstawieniu tak
wycietego tekstu do Worda?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-03 16:32
>A nie lepiej zostawic to przyszym wersjom przegladarek i ograniczyc sie do
>definiowania jezyka?

Oczywiście, że nie. Nie zamierzam kontroli nad czymś tak istotnym jak
POPRAWNOŚĆ językowa tekstów, zostawić jakimś prymitywnym maszynkom napisanym
za oceanem. Poza tym nie wyobrażam sobie, kiedy miałaby powstać darmowa
przeglądarka, która miała w sobie zawarte algorytmy wyświetlania dla
kilkuset używanych na świecie języków.

Założenia projektu, który planuję, przewidują całkowitą kontrolę nad
wyglądem strony WWW po stronie projektanta.

>Poza tym przy kopiowaniu takiego tesktu do schowka, OE wstawia znak "-" w
>miejsce ­. Domyslasz sie zatem jaki jest efekt przy wstawieniu tak
>wycietego tekstu do Worda?

To nic.

Założenia projektu, który planuję, nie wymagają, aby użytkownik coś kopiował
do schowka.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-04 10:56
>Założenia projektu, który planuję, przewidują całkowitą kontrolę nad
>wyglądem strony WWW po stronie projektanta.

[...]

>Założenia projektu, który planuję, nie wymagają, aby użytkownik coś kopiował
>do schowka.

To po co wogóle robisz to w HTML'u? Już nie raz pokazano, że nie nadaje się
on do dokładnego opisywania wyglądu stron.

Dlaczego nie robisz tego w PDF'ie?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-07 16:20
>
>>A nie lepiej zostawic to przyszym wersjom przegladarek i ograniczyc sie do
>>definiowania jezyka?
>
>Oczywiście, że nie. Nie zamierzam kontroli nad czymś tak istotnym jak
>POPRAWNOŚĆ językowa tekstów, zostawić jakimś prymitywnym maszynkom napisanym
>za oceanem.

Moze nie beda prywitywny? A moze nawet nie beda pochodzic zza oceanu, bo to
chyba dla Ciebie najwazniejsze?

>Poza tym nie wyobrażam sobie, kiedy miałaby powstać darmowa
>przeglądarka, która miała w sobie zawarte algorytmy wyświetlania dla
>kilkuset używanych na świecie języków.

"Nie wyobrzam sobie, by kiedykolwiek potrzeba bylo wiecej niz 640kB pamiec"
:))

>Założenia projektu, który planuję, przewidują całkowitą kontrolę nad
>wyglądem strony WWW po stronie projektanta.

Szkoda czasu na cos, czego przydatnosc jest mocno watpliwa...
Przydatnosc je tak duza jak szkodliwosc ze wzgledu na objetosc tekstu. Wiec
na jedno wychodzi.

>>Poza tym przy kopiowaniu takiego tesktu do schowka, OE wstawia znak "-" w
>>miejsce ­. Domyslasz sie zatem jaki jest efekt przy wstawieniu tak
>>wycietego tekstu do Worda?
>
>To nic.

Nic???

>Założenia projektu, który planuję, nie wymagają, aby użytkownik coś kopiował
>do schowka.

A jesli zechce cos wyciac ze strony? Jakis tekst i wydrukowac po Wordem?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-07 20:21
>>Oczywiście, że nie. Nie zamierzam kontroli nad czymś tak istotnym jak
>>POPRAWNOŚĆ językowa tekstów, zostawić jakimś prymitywnym maszynkom
napisanym
>>za oceanem.
>Moze nie beda prywitywny? A moze nawet nie beda pochodzic zza oceanu, bo
to
>chyba dla Ciebie najwazniejsze?

No dobrze, jeżeli to będzie MSIE, to najwyżej będą pochodzić z Katowic. Ale
niewiele to zmieni. I tak nie zamierzam wierzyć tym algorytmom, zaś gdy ja
to robię server-side, to zawsze mogę skontrolować wynik.

>Szkoda czasu na cos, czego przydatnosc jest mocno watpliwa...
>Przydatnosc je tak duza jak szkodliwosc ze wzgledu na objetosc tekstu.

Nawet jeżeli chodzi o prezentację w intranecie?

>A jesli zechce cos wyciac ze strony? Jakis tekst i wydrukowac po Wordem?

Co Ty się przejmujesz moimi stronami? Przecież to moje strony i moi
użytkownicy. To ja się tym będę martwił. A zapewniam Cię, że wiem co robię.

>To po co wogóle robisz to w HTML'u? Już nie raz pokazano, że nie nadaje
się
>on do dokładnego opisywania wyglądu stron.

Ależ bardzo dobrze się nadaje, na tyle, na ile ja tego potrzebuję.

>Dlaczego nie robisz tego w PDF'ie?

_Też_ zamierzam robić.

Przewiduję pięć wersji prezentacji dokumentów: (1) HTML 4.0+CSS i ilustracje
GIF/JPEG, (2) HTML 4.0+CSS i ilustracje Flash, (3) HTML 3.2 i ilustracje
GIF/JPEG, (4) HTML 3.2 i ilustracje Flash, (5) PDF. Wszystko będzie tworzone
poprzez XML i XSL(T). PDFy będą z pdfTeXa, więc de facto rzeczywiście
skłaniam się ku zastosowaniu algorytmów TeXa również po stronie webowej.

Ale przecież ja się Was w ogóle nie pytam CO mam robić, bo ja doskonale wiem
co mam robić. Założenia projektu są sprecyzowane. Ze względu na to, że będą
zawarte tam teksty wielojęzyczne, będziemy używali Unicode, więc i tak
niestety odpada używalność różnych egzotycznych przeglądarek i platfrom nie
stosujących się do międzynarodowych standardów. Poza tym będę używane
dynamiczne fonty EOT i PFR (więc może jednak uda nam się stworzyć
nieunikodową wersję dla Netscape 4.x). Takie są założenia, i o nich nie ma
tu co dyskutować.

Pytałem o to, JAK pewną rzecz trzeba zrobić. Za dobre rady w rodzaju "nie
rób bo nie warto" serdecznie dziękuję, ale to nie do końca jest to, na co
liczyłem. Ja WIEM doskonale jakie są profity z rozwiązania, nad którym
pracuję, WIEM również jakie są potencjalne problemy.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-08 08:55
Pytanie: jak przerobic literke 'a' na 'b'
Odpowiedz: moze i sa jakies narzedzia, ale to chyba mija sie z celem, po co
to? nie lepiej od razu uzyc 'b'???

Pytanie: nie, takie sa zalozenia projektu, musi byc 'a' ktore uzytkownikowi
bedzie pokazywane jako 'b'.
Odpowiedz: To juz nic nie kapuje, a moze lepiej zrobic to jakos po ludzku??

Pytanie:
>Ale przecież ja się Was w ogóle nie pytam CO mam robić, bo ja doskonale
wiem
>co mam robić. [cytat autentyczny]


Kolejny czlowiek z problemem JAK TO ZROBIC. Ale zeby wytlumaczyc po co, to
juz nie bo on 'doskonale wie co ma robic'. Ludzie staraja sie pomoc,
kombinuja jak tu normalnie rozwiazac problem, a ten mowi ze sie ich o to w
ogole nie pyta.

Problem nalezy rozgryzac od samego dna, wtedy grupa moze podsunac jakies
rozwiazanie, a jak ktos uwaza ze wymyslil juz genialne rozwiazanie tylko nie
wie jak przerobic 'a' na 'b' no to sorry.

PS. nie moglem sie powstrzymac
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-08 14:16
>Pytanie: jak przerobic literke 'a' na 'b'
>Odpowiedz: moze i sa jakies narzedzia, ale to chyba mija sie z celem, po
co
>to? nie lepiej od razu uzyc 'b'???
>Pytanie: nie, takie sa zalozenia projektu, musi byc 'a' ktore
uzytkownikowi
>bedzie pokazywane jako 'b'.
>Odpowiedz: To juz nic nie kapuje, a moze lepiej zrobic to jakos po
ludzku??

Pytanie: Jak stąd dojechać do Radomia?
Odpowiedź: Paanie, co Pan będziesz do Radomia jechał. Jedź Pan do Kłodzka,
tam ładniej.

To jest Twoim zdaniem normalna odpowiedź? Jeśli tak, to gratuluję i życzę
sobie, żebym nigdy CIę nie musiał pytać o drogę.

W ogóle rozumiem Twojego porównania. Co rozumiesz przez "a" i "b"? Co
rozumiesz przez "od razu użyć b"??? Jeżeli sprowadzasz coś na poziom
abstrakcji, to albo rób to rzetelnie, albo podaruj sobie takie "oratorskie
popisy".

Interpretując Twoją "grę" pytanie-odpowiedź:
Pytanie: jak przerobić nie podzielony tekst HTML na tekst podzielony?
Odpowiedź: Może i są jakieś narzędzia, ale to chyba mija się z celem, po co
to? Nie lepiej od razu użyć podzielonego tekstu?
Pytanie: No tak, ale SKĄD JA WEZMĘ ten podzielony tekst? O to się właśnie
pytam! Założenia projektu są takie, że musi być jak najbardziej poprawny pod
względem typograficznym tekst w HA-TE-EM-ELu.
Odpowiedź: To już nic nie kapuje, a może lepiej zrobić to jakoś po ludzku??
Pytanie: Ale jak??? Powtarzam: ma być to w HTML (to chyba normalne skoro
mowa o WWW) i ma to być możliwie poprawne typograficznie, w szczególności
nie ma być kanałów.
Odpowiedź: Yyyy... Nie wiem... Yyyy... Ja tylko strony w Notatniku piszę.

>Kolejny czlowiek z problemem JAK TO ZROBIC. Ale zeby wytlumaczyc po co, to
>juz nie bo on 'doskonale wie co ma robic'.

Czy jest jakaś różnica między tym czy zamierzam to zrobić w celach
rozrywkowych, komercyjnych, naukowych czy jakichś innych? Napisałem
przecież: "dowolna technologia". Nawet jakbyś mi zaoferował program w
GFABasicu pod Atari ST to bym przyjął.

>Ludzie staraja sie pomoc,
>kombinuja jak tu normalnie rozwiazac problem, a ten mowi ze sie ich o to w
>ogole nie pyta.

Nie. Ludzie mi proponują, żeby zrobić w PDFie albo zostawić przyszłym
wersjom, albo stwierdzają, że ma to wątpliwą przydatność. Co to są za
porady? Jak dla mnie to są to właśnie porady w rodzaju "jedź Pan do Kłodzka,
tam ładniej". Kiedy ja MUSZĘ jechać do Radomia bo... szwagier ma ślub, matka
umarła, siostrze się syn urodził... NIEWAŻNE. Czy jeżeli pytasz kogoś o
drogę do Radomia, to musisz mu się najpierw zwierzać, czy jedziesz w
odwiedziny do szwagra czy na pogrzeb własnej matki? A co to komu pomoże, jak
mu się zwierzysz? Poda CI lepsze połączenie kolejowe, albo wyjawi, gdzie
jest najmniej korków?

>Problem nalezy rozgryzac od samego dna, wtedy grupa moze podsunac jakies
>rozwiazanie,

Co przez to rozumiesz? Jakie może być "dno" mojego problemu? Ja PO PROSTU
potrzebuję tekstu w HTML lub XML podzielonego na sylaby. Czy ten problem ma
jakieś "dno"?

>a jak ktos uwaza ze wymyslil juz genialne rozwiazanie tylko nie
>wie jak przerobic 'a' na 'b' no to sorry.

Nie. Ja właśnie NIE WYMYŚLIŁEM żadnego genialnego rozwiązania, ani tym
bardziej nie zamierzam przerabiać żadnego "a" na żadne "b". Ja chcę uzyskać
najprostszą rzecz pod Słońcem (w sensie sformułowania problemu).

Ja po-trze-bu-ję po pro-stu PO-DZIE-LIĆ TEKST HTML NA SY-LA-BY!!!
Po-pra-wnie!!!

Czy to trzeba komuś wyjaśniać? Czy potrzebę przenoszenia wyrazów w tekście,
szczególnie w tekście wyrównywanym do obu marginesów, TRZEBA KOMUŚ
TŁUMACZYĆ? Chyba tylko analfabecie??? Przecież wyrazy w druku i w piśmie
przenosi się od kilkuset lat, uczyliśmy się tego wszyscy w szkole
podstawowej!

Po prostu myślałem, że tak oczywistych rzeczy nie trzeba nikomu wyjaśniać.
Jakbyś się czuł, gdybym zaczął Ci wyjaśniać: "Wiesz, na stronach WWW powinno
być również trochę ilustracji, nie tylko sam tekst."

Wracając do problemu -- powtarzam.

Ja WIEM, co zamierzam zrobić. Wiem też, że się to zrobić DA. Wiem, że w
HTMLu jest odpowiedni mechanizm (­), interpretowany poprawnie przez
najpopularniejszą przeglądarkę. Gdyby tego nie było, to raczej bym się nie
wyrywał. Do tej pory teksty dzieliłem ręcznie i półautomatycznie. Szukam
rozwiązania na automatyzację tego procesu, bo przy dynamicznym tworzeniu
stron w oparciu o XML takie podejście nie ma racji bytu. Szukam więc
odpowiedniego NARZĘDZIA, tudzież sposobu skorzystania z narzędzi
ISTNIEJĄCYCH (MS HAPI, TeX).

Rada w rodzaju "może zostawić to przyszłym wersjom przeglądarek" jest
niepoważna, bo gdybym zamierzał to zostawić przyszłym wersjom, to bym się
teraz o to nie pytał. Jest to dokładnie rada w rodzaju "a może zadzwoni Pan,
może oni do Pana przyjadą, po co się Pan będzie do Radomia pchał".

Oceny, że "przydatność jest mocno wątpliwa" mnie nie interesują, bo to ja i
mój klient jesteśmy od oceniania przydatności. Zresztą jeżeli ktoś pisze, że
przydatność przenoszenia wyrazów jest mocno wątpliwa, to chyba nigdy w życiu
nie trzymał w ręku książki ani gazety. Zresztą gdybym szukał opinii na temat
moich pomysłów czy stron, to pewnie zgłosiłbym się na
pl.comp.www.nowe-strony. Do tej pory wydawało mi się, że w grupach
dyskusyjnych na konkretnie zadane pytania można liczyć na konkretnie
udzieloną odpowiedź. Ja w każdym razie zwykle staram się takich właśnie
odpowiedzi udzielać, np. na pl.comp.dtp.

Szanownym Kolegom chyba zabrakło jednak woli. W takim razie życzę miłego
dnia,
Adam
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-08 22:39
>Ja po-trze-bu-ję po pro-stu PO-DZIE-LIĆ TEKST HTML NA SY-LA-BY!!!
>Po-pra-wnie!!!
>
Adam, uspokój się. Już?

PS. AFAIK dzielenie na sylaby nie jest tożsame z dzieleniem w celu
przenoszenia wyrazów. To znaczy najczęściej przenosi się na podziałach
sylab, ale nie zawsze.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-09 00:40
message

>PS. AFAIK dzielenie na sylaby nie jest tożsame z dzieleniem w celu
>przenoszenia wyrazów. To znaczy najczęściej przenosi się na podziałach
>sylab, ale nie zawsze.

Ja o tym wiem, i Ty o tym wiesz. Ale dla koledgów uważających, że
"przydatność jest mocno wątpliwa" byłoby to chyba zbyt skomplikowane...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 00:50
>message
>
>>PS. AFAIK dzielenie na sylaby nie jest tożsame z dzieleniem w celu
>>przenoszenia wyrazów. To znaczy najczęściej przenosi się na podziałach
>>sylab, ale nie zawsze.
>
>Ja o tym wiem, i Ty o tym wiesz. Ale dla koledgów uważających, że
>"przydatność jest mocno wątpliwa" byłoby to chyba zbyt skomplikowane...

Cos chciales przez to powiedziec, czy tylko tak sie przyczepic?
Zapewne to drugie, wiec AFAIR dla kolegow jest zbyt skomplikowane, po co
ktos chce meczyc sie w dzielenie wyrazow, skoro to ewidetnie ma dzialac
jako proteza (o czym swiadczy inna wersja dla Netscape'a).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 06:02
>ktos chce meczyc sie w dzielenie wyrazow, skoro to ewidetnie ma dzialac
>jako proteza (o czym swiadczy inna wersja dla Netscape'a).

Nie, to nie jest proteza. Po prostu zamierzam przygotowywać strony na tyle
dobrze, na ile umożliwia to dana przeglądarka. Idąc za Twoją logiką,
wszystkie strony z Flashem to "protezy", bo projektanci przygotowują też
wersje "HTML-only".

Niektóre założenia projektu przewidują, że dana strona WWW musi wyglądać TAK
SAMO we wszystkich ważniejszych przeglądarkach. Wtedy siłą rzeczy
przygotowuje się stronę w HTML 3.2.

Inne projekty (w tym mój) zakładają, że dana strona ma jak najlepiej
wykorzystywać możliwości odpowiednio każdej przeglądarki, pod warunkiem, że
nie robi problemów z przeglądarkami innymi/starszymi. W ramach takiego
projektu można używać (oczywiście teoretycznie, i niekoniecznie wszystko
naraz) DHTML, ActiveX, Javy, Flasha, CSS (nawet CSS 3), kolorowych
scrollbarów (IE 5.5) -- pod warunkiem, że albo rozszerzenia będą napisane na
jednej stronie, ale "transparentnie", albo też gdy będą osobne strony dla
różnych przeglądarek.

Gdy generuje się strony z XML+XSL, to przygotowanie licznych wersji stanowi
ZERO problemu.

Zupełnie nie rozumiem, po co ta cała dyskusja. Powtarzam po raz któryś z
rzędu: ja się nie pytam CZY (bo to wiem od dawna), tylko się pytam JAK.
Inaczej mówiąc, nie interesuje mnie porada merytoryczny, tylko techniczna. I
myślałem, że od tego właśnie jest ta grupa...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 08:24
>Inaczej mówiąc, nie interesuje mnie porada merytoryczny, tylko techniczna. I
>myślałem, że od tego właśnie jest ta grupa...

przecież to jest pl.* ):

przeme2K

ps. napisz jeśli będzie ci można jakoś pomóc z texem
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 13:18
>
>>ktos chce meczyc sie w dzielenie wyrazow, skoro to ewidetnie ma dzialac
>>jako proteza (o czym swiadczy inna wersja dla Netscape'a).
>
>Nie, to nie jest proteza. Po prostu zamierzam przygotowywać strony na tyle
>dobrze, na ile umożliwia to dana przeglądarka. Idąc za Twoją logiką,
>wszystkie strony z Flashem to "protezy", bo projektanci przygotowują też
>wersje "HTML-only".

Raczej niezgodnie z moja logika, bo odrozniam prace tworcza (Flash) od
mechanicznej (dzielenie wyrazow przez serwer).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 15:28
>Raczej niezgodnie z moja logika, bo odrozniam prace tworcza (Flash) od
>mechanicznej (dzielenie wyrazow przez serwer).

Dla niektórych dobre opracowanie typograficzne to też praca twórcza, ale Ty
pewnie nie wiesz, co oznacza opracowanie typograficzne (tym bardziej dobre).

>Mam nadzieje, Twoj serwer z redaktorem bedzie chlubnym wyjatkiem w polskim
>internecie. I wyjatkiem pozostanie.

Tak uważasz? Ja liczę na to, że poważniejsze serwisy WWW w polskim
Internecie dorobią się wreszcie kiedyś korekty językowej, redakcji
technicznej i merytorycznej, a nie, że wszystkie te obowiązki wykonywał
będzie grafik-samouk lub informatyk-administrator Unixa. Obecnie niejeden
duży portal internetowy żenuje poziomem językowym gorszym niż byle
powielaczowa gazetka gminna czy parafialna.

>>Co mają humaniści do algorytmów?
>
>Zartujesz? Czy sadzisz, ze ktos lepiej od nich zna sposob i problemy z
>dzieleniem wyrazow?

Ale co innego kwestia zasad poprawności, a co innego algorytm stosujący te
zasady. Humaniści rzadko myślą w kategoriach algorytmów.

>Faktycznie nie zrozumiales co napisalem, albo masz klopoty z czytaniem --
>domyslam sie, ze nie mozna skorzystac z algorytmow Microsoftu. Wspolczuje
>Ci, jesli myslales, ze ktos Ci je udostepni za darmo, albo ze sa tacy,
>ktorzy sadza, ze udostepnia sie to za darmo.

Dlaczego? To wcale nie jest oczywiste. Microsoft upublicznia wiele
specyfikacji interfejsów do swoich technologii. Ale akurat w tym przypadku
API nie jest publiczne. To raczej wyjątak niż reguła.

Proponuję EOT.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 18:35
>>Raczej niezgodnie z moja logika, bo odrozniam prace tworcza (Flash) od
>>mechanicznej (dzielenie wyrazow przez serwer).
>
>Dla niektórych dobre opracowanie typograficzne to też praca twórcza, ale
Ty
>pewnie nie wiesz, co oznacza opracowanie typograficzne (tym bardziej
dobre).

Tak z przekory odpowiem. Wyglada na to ze sam sobie przeczysz. Bo z jednej
strony chcesz miec algorytm na to, a z drugiej piszesz ze to jest praca
tworcza.
Jak wiec zrobisz system, ktory bedzie to robil automatycznie to to jest
guzik a nie
praca tworcza. Tak wiec chyba sam sobie przeczysz, albo to raczej tzw.
przerost
formy nad trescia gdyz nie potrafisz przyjac do wiadomosci ze nie masz racji
i
z definicji mowisz NIE do dowolnego stwierdzenia przedmowcy bez
zastanowienia.

no offence  :) - mozesz nie odpowiadac.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 21:31
>Tak z przekory odpowiem. Wyglada na to ze sam sobie przeczysz. Bo z jednej
>strony chcesz miec algorytm na to, a z drugiej piszesz ze to jest praca
>tworcza.
>Jak wiec zrobisz system, ktory bedzie to robil automatycznie to to jest
>guzik a nie
>praca tworcza. Tak wiec chyba sam sobie przeczysz, albo to raczej tzw.
>przerost
>formy nad trescia gdyz nie potrafisz przyjac do wiadomosci ze nie masz
racji
>i
>z definicji mowisz NIE do dowolnego stwierdzenia przedmowcy bez
>zastanowienia.

Ależ nie. Przecież specjalnie pisałem o tym, że nad tekstem musi czuwać
redaktor. Podstawą nowoczesnego łamania tekstów na potrzeby druku są
algorytmy -- procedury dzielące wyrazy według zasad gramatycznych, ale
jednocześnie funkcje, które próbują optymalizować skład gwarantując jak
najbardziej jednolity "kolor" złożonego tekstu. Do takich algorytmów należy
m.in. HZ, opracowany przez prof. Hermanna Zapfa i dr. Petera Karowa, a
zaimplementowany niedawno w programie Adobe InDesign, a także system TeX
prof. Donalda Knutha.

Oczywiście algorytmy te, mimo iż bazują na wielosetletnich doświadczeniach
drukarzy, przeważnie europejskich, to jednak nie są w stanie zapewnić
stuprocentowej estetyki składu, gdyż ta podlega kryteriom _estetycznym_
właśnie, czyli jest zależna od gustu.

Kreatywna praca dzisiejszego składacza -- również podczas opracowywania
tekstu na potrzeby screen design! -- polega na ocenie jakości estetycznej
złożonego tekstu i próbach ręcznej interwencji tam, gdzie algorytm nie
stworzył zadawalających rezultatów. Nie może być to zatem praca mechaniczna,
gdyż jej rezultaty tylko w części podlegają kryteriom mierzalnym (np.
poprawność językowa), po części zaś jedynie kryteriom estetycznym, a więc
niemierzalnym.

Jak dla mnie, algorytm dzielenia jest tylko kolejnym narzędziem w rękach
kreatywnego typografa -- podobnie jak w odnośnych dziedzinach filtry
Photoshopa, kreatory baz danych Accessa czy wspomniany HZ. Można
bezkrytycznie przyjmować wynik działania tych automatów, albo używać ich
jako swoistego bryka.

Poza tym nie można zapominać o tym, że algorytmy też są tworzone przez
ludzi, a więc efekt ich działania to też efekt kreacji. Przede wszystkim
można to zauważyć w zależności kreacji użytkownika od kreacji twórców
narzędzia. Mówiąc prościej: wraz ze wzrostem możliwości nowych wersji
narzędzi (np. programów) w wyniku kreatywnej pracy programistów, zmieniają
się efekty kreatywnego działania użytkowników tych narzędzi. Np. film taki
jak "Matrix" nie mógłby powstać 10 lat temu.

Jeżeli uważasz to za "przerost formy nad treścią", wolna droga. Nikt nie
jest w stanie na siłę wcisnąć Ci wrażliwości na tę akurat dziedzinę
tworzenia. Zapewniam Cię jednak, że są ludzie, którzy są odmiennego zdania.
Gdyby tak nie było, wszystkie wytwory drukarstwa światowego przypominałyby
dzisiejszy "Super Express", zaś wszystkie strony internetowe wyglądałyby jak
osławiona tu "web 4 all".

Pozdrawiam,
Adam Twardoch
(między innymi delegat krajowy Polski w międzynarodowym stowarzyszeniu
typograficznym ATypI)
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-09 02:12
>pl.comp.www.nowe-strony. Do tej pory wydawało mi się, że w grupach
>dyskusyjnych na konkretnie zadane pytania można liczyć na konkretnie
>udzieloną odpowiedź. Ja w każdym razie zwykle staram się takich właśnie
>odpowiedzi udzielać, np. na pl.comp.dtp.

Cóż, młodzież się jeszcze tego nie nauczyła... :)

Problem dzielenia wyrazów po stronie serwera jest szalenie interesujący,
ale myślę że przerasta większość czytelników p.c.w.s-s. Dlatego
tłumaczenie się (szczególnie tak wyczerpujące), z zadanego pytania jest,
wg mnie, marnowaniem czasu. W internetowych newsach często
natrafimy osoby, które _wiedzą_lepiej_ czego potrzebujemy...

EOT!

Pozdrowienia,
KarolR.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-09 03:43
>Problem dzielenia wyrazów po stronie
>serwera jest szalenie interesujący

Uff... Przynajmniej jeden :)

Chyba więc sam będę musiał z tym powalczyć. Rozwiązanie jest chyba tylko
jedno -- wzorce TeXa...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 00:42
>Chyba więc sam będę musiał z tym powalczyć. Rozwiązanie jest chyba tylko
>jedno -- wzorce TeXa...

Z pewnością zna Pan artykuł "Tam gdzie minus oznacza dzielenie"
Bogusława Jackowskiego i Marka Ryćki, dostępny w "Wirtualnej
Akademii" TeXa? Ładnie tam jest wyjaśnione jak kożystać ze wzorców.

Zastanawiam się tylko, czy licencja TeXa (MeXa) zezwala na wykorzystanie
wzorców w innym projekcie?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 00:52
>Dnia Sat, 9 Sep 2000 03:43:30 +0200, Adam Twardoch

>Akademii" TeXa? Ładnie tam jest wyjaśnione jak kożystać ze wzorców.

Ups... Oczywiście "korzystać"!
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 01:32
>Z pewnością zna Pan artykuł "Tam gdzie minus oznacza dzielenie"
>Bogusława Jackowskiego i Marka Ryćki, dostępny w "Wirtualnej
>Akademii" TeXa? Ładnie tam jest wyjaśnione jak kożystać ze wzorców.

Znam. Chyba faktycznie zadzwonię do Marka albo Bogusia i poprpszę ich o
pomoc.

>Zastanawiam się tylko, czy licencja TeXa (MeXa) zezwala na wykorzystanie
>wzorców w innym projekcie?

Zezwala.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 00:16
>
>Zezwala.
>
To dobrze.
W każdym razie, mogę z całą pewnością stwierdzić, że da się wykorzytać
wzorce TeXa. Mam już kawałek skryptu. Dzieli tylko jedno słowo, tylko w
języku polskim (ale to najmniejszy problem), a wydajność jest fatalna.
Ale działa...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 00:19
>
>W każdym razie, mogę z całą pewnością stwierdzić, że da się wykorzytać
>wzorce TeXa. Mam już kawałek skryptu.

Zapomniałem napisać, że skrypt jest napisany w PHP.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 01:56
napisał(a):
>>
>>W każdym razie, mogę z całą pewnością stwierdzić, że da się wykorzytać
>>wzorce TeXa. Mam już kawałek skryptu.
>
>Zapomniałem napisać, że skrypt jest napisany w PHP.

Ciekawe :)

A.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 17:18
>
>Ciekawe :)
>
>A.

Niestety, ze względu na wydajność (stukrotnie powtórzone słowo
'stusiedemdziesięcioletni' serwer przerabiał ponad 10 sekund) nie nadaje
się (narazie) toto do użytku :(
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-23 00:39
>Niestety, ze względu na wydajność (stukrotnie powtórzone słowo
>'stusiedemdziesięcioletni' serwer przerabiał ponad 10 sekund) nie nadaje
>się (narazie) toto do użytku :(

Ale zato tu znalazłem coś ciekawego:

http://www.perl.com/CPAN/modules/by-module/TeX/TeX-Hyphen-0.101.tar.gz

Jeszcze nie testowałem, ale chyba nie wspiera polskich znaczków...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-24 11:44
Już wspiera. ;)

Nawiasem mówiąc, skubany jest szybki. Tysiąc razy
'stusiedemdziesięcioczteroletni' zrobił w 20 sekund, ale 'idziemy' już
tylko w 9s.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-27 04:10
>Już wspiera. ;)
>
>Nawiasem mówiąc, skubany jest szybki. Tysiąc razy
>'stusiedemdziesięcioczteroletni' zrobił w 20 sekund, ale 'idziemy' już
>tylko w 9s.

Cholernie mnie zaciekwaiłeś :)

A.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-27 23:36
>Cholernie mnie zaciekwaiłeś :)
>
>A.
>

Dla polskiego wystarczyły kosmetyczne zmiany, przypuszczam, że dla
innych języków (z alfabetem opartym na łacińskim oczywiście) jest
podobnie. Mógłbym się dowiedzieć, jakie języki w szczególności byłyby
potrzebne?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-29 00:32
>Dla polskiego wystarczyły kosmetyczne zmiany, przypuszczam, że dla
>innych języków (z alfabetem opartym na łacińskim oczywiście) jest
>podobnie. Mógłbym się dowiedzieć, jakie języki w szczególności byłyby
>potrzebne?

Angielski i niemiecki. Na upartego jeszcze czeski, francuski i rosyjski :))

A.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-10-04 20:33
>Angielski i niemiecki. Na upartego jeszcze czeski, francuski i rosyjski :))

Oryginalną wersję skryptu napisał Czech, a wzorce angielskie skrypt ma
nawet
wbudowane, więc nie trzeba osobnego pliku. Francuski może udałoby mi
się jakoś wykombinować ("ugryzłem" nieco tego języka w szkole i na
studiach). Ale z niemieckim, a rosyjskim w szczególności, miałbym
problemy. Co do niemieckiego: nie rozumiem zapisu wzorców (co wynika
oczywiście z nieznajomości języka i niskiej świadomości TeXowej - co
oznaczają nawiasy klamrowe we wzorcach, jak w nich zapisywane są
poszczególne niemieckie znaczki?).

Jeśli jest Pan zainteresowany, mogę podesłać to, co już mam (tzn. moduł
dla czeskiego, angielskiego i polskiego). Nad innymi językami będę
myślał (choćby dla zaspokojenia własnej ambicji :) ).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-11 01:43
>>Problem dzielenia wyrazów po stronie
>>serwera jest szalenie interesujący
>
>Uff... Przynajmniej jeden :)
>
>Chyba więc sam będę musiał z tym powalczyć. Rozwiązanie jest chyba tylko
>jedno -- wzorce TeXa...
>
jest tu pewien problem na ktory trzeba zwrocic uwage -- jezeli nie
uzyjesz formatowania tagiem <PRE> to calosc ma b. duza szanse sypnac
sie w przegladarce.

ale zakladam, ze wiesz o tym doskonale :)

pomijajac ten haczyk dzielenie wyrazow sprowadza sie do oprogramowania
tego na serwerze (przypuszczalnie musial bys napisac odpowiednia
procedurke w jezyku skryptowym ktory generowal by te strony).

do tego dochodzi ten problem, ze bylo by to dosc sztuczne, poniewaz
dzielenie wyrazow w tekscie ma (afaik) na celu wyrownanie szerokosci
wierszy przy jednoczesnym zachowaniu szerokosci spacji. w przypadku
internetu nie sposob raczej sprawdzic ile znakow zmiesci sie w linii,
wobec czego zmuszony bylbys uzywac fontu nieproporcjonalnego, a ten, o
ile mi wiadomo, gorzej sie czyta (pomijajac oczywiscie wyglad).

teoretycznie umiem sobie wyobrazic sposob ominiecia tego (na podstawie
statystyki szerokosci znakow w fontach proporcjonalnych), ale to
naprawde sporo zabawy i nie wiem czy wartej efektu.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-11 14:54
>jest tu pewien problem na ktory trzeba zwrocic uwage -- jezeli nie
>uzyjesz formatowania tagiem <PRE> to calosc ma b. duza szanse sypnac
>sie w przegladarce.

Nie rozumiem?
Widziałeś stronę
http://193.174.120.13/twardoch/f/pl/font/sparing/sparing_ie.html
(oglądać w MS IE 5.x).

Mniej więcej o to mi chodziło. Powyższa strona nie jest bynajmniej "apogeum"
jakości typograficznej. Została przygotowana szybko i niechlujnie. Ale i tak
widać, że dopiero podzielony tekst wyrównywany obustronnie da się czytać.

>w przypadku
>internetu nie sposob raczej sprawdzic ile znakow zmiesci sie w linii,

To nie ma znaczenia, jeżeli możemy przypuścić (a w większości przypadków
możemy), że wszystkie wiersze są potencjalnie jednakowej szerokości.

>teoretycznie umiem sobie wyobrazic sposob ominiecia tego (na podstawie
>statystyki szerokosci znakow w fontach proporcjonalnych), ale to
>naprawde sporo zabawy i nie wiem czy wartej efektu.

Sprawa jest zupełnie prosta. Im więcej podziałów, tym mniej dziur w
składzie. W Internecie jak dotąd nie widziałem sensownych przypadków
stosowanie składu wyrównywanego obustronnie, zaś u tych, którzy się na to
poważyli, praktycznie zawsze kończyło się to klęską.

Oczywiście postulat częstych podziałów stoi często w sprzeczności z innymi
postulatami, np. z postulatem ograniczenia liczby następujących po sobie
podziałów, albo niezawieszania jednoliterowych spójników. Ponieważ jednak
przeglądarki nie są wyposażone w inteligentne systemy łamania tekstu, więc
postulaty te chyba można na razie zignorować, dając absolutny priorytet
postulatowi częstych podziałów.

Jak widać w moim tekście, praktycznie wszystkie miejsca, w których tekst
wygląda nieładnie, to miejsca, gdzie nie ma podziału następnego wyrazu (nie
zadziałała uproszczona procedura).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-12 01:21
>
>
>>jest tu pewien problem na ktory trzeba zwrocic uwage -- jezeli nie
>>uzyjesz formatowania tagiem <PRE> to calosc ma b. duza szanse sypnac
>>sie w przegladarce.
>
>Nie rozumiem?
>Widziałeś stronę
>http://193.174.120.13/twardoch/f/pl/font/sparing/sparing_ie.html
>(oglądać w MS IE 5.x).
>
>Mniej więcej o to mi chodziło. Powyższa strona nie jest bynajmniej "apogeum"
>jakości typograficznej. Została przygotowana szybko i niechlujnie. Ale i tak
>widać, że dopiero podzielony tekst wyrównywany obustronnie da się czytać.
>
No tak, &shy; nie brałem pod uwagę... Tyle, że tutaj z kolei widzę co
najmniej 2 dodatkowe problemy:

1. MiSIE 5.x only
2. Wielkość pliku rośnie potężnie -- pierwszy akapit z 460 do 690
znaków.

Obie te cechy nieco tracą na znaczeniu gdy korzysta się z tych
dokumentów tylko i wyłącznie w intranecie -- jeżeli takie ma być
zastosowanie, to problem jest mniejszy (co nie znaczy, że nie
istnieje).

>>w przypadku
>>internetu nie sposob raczej sprawdzic ile znakow zmiesci sie w linii,
>
>To nie ma znaczenia, jeżeli możemy przypuścić (a w większości przypadków
>możemy), że wszystkie wiersze są potencjalnie jednakowej szerokości.
>
W przypadku &shy; nie, ale jak dla mnie to najwyżej półśrodek.

>>teoretycznie umiem sobie wyobrazic sposob ominiecia tego (na podstawie
>>statystyki szerokosci znakow w fontach proporcjonalnych), ale to
>>naprawde sporo zabawy i nie wiem czy wartej efektu.
>
>Sprawa jest zupełnie prosta. Im więcej podziałów, tym mniej dziur w
>składzie. W Internecie jak dotąd nie widziałem sensownych przypadków
>stosowanie składu wyrównywanego obustronnie, zaś u tych, którzy się na to
>poważyli, praktycznie zawsze kończyło się to klęską.
>
>Oczywiście postulat częstych podziałów stoi często w sprzeczności z innymi
>postulatami, np. z postulatem ograniczenia liczby następujących po sobie
>podziałów, albo niezawieszania jednoliterowych spójników. Ponieważ jednak
>przeglądarki nie są wyposażone w inteligentne systemy łamania tekstu, więc
>postulaty te chyba można na razie zignorować, dając absolutny priorytet
>postulatowi częstych podziałów.
>
>Jak widać w moim tekście, praktycznie wszystkie miejsca, w których tekst
>wygląda nieładnie, to miejsca, gdzie nie ma podziału następnego wyrazu (nie
>zadziałała uproszczona procedura).
>
Cały problem polega na tym, że jeżeli chcesz tego użyć w internecie
(publicznie dostępne) to sam prosisz się o problemy :) Nie mam w domu
zainstalowanej mozilli, sprawdzę w pracy czy obsługuje ona &shy; i
jeżeli tak, to ma to odrobinę większe szanse powodzenia.

Pomijając oczywiście, że zupełnie nie odpowiedziałem na Twoje pytanie,
ale to tylko drobny szczegół :)
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 06:00
>1. MiSIE 5.x only

Strony mają być tworzone z XML+XSL, do kilku różnych wersji. Wersje będą
wybierane po części automatycznie (marka i wersja przeglądarki), po części
na życzenie użytkownika (preferencje zapisywane w cookies, oczywiście
domyślnie będzie wybrana wersja mniej rozbudowana).

>2. Wielkość pliku rośnie potężnie -- pierwszy akapit z 460 do 690
>znaków.

Przewidywana wersja z dzieleniem to wersja "deluxe". Będą tam też dynamiczne
fonty OpenType, grafika Flash, większe bitmapy, całość optymalizowana na
rozdzielczość 1024x768.

>W przypadku &shy; nie, ale jak dla mnie to najwyżej półśrodek.

Dlaczego? W ten sposób (poprzez "wlewanie" dywizów) od lat składa się po
polsku w Quarku, najpopularniejszym programie DTP na świecie, a także w
Calamusie, Venturze, PageMakerze, InDesignie... Dlaczego podstawowych zasad
typografii nie stosować również w WWW, szczególnie, że medium na to pozwala
(pod warunkiem, że użytkownik posiada odpowiednią przeglądarkę, ale jak
pisałem wyżej, to nie jest problem).

>Cały problem polega na tym, że jeżeli chcesz tego użyć w internecie
>(publicznie dostępne) to sam prosisz się o problemy :)

Ale to moje problemy :) Już nie raz pisałem tutaj, że moimi problemami zajmę
się sam. Mam już kilka lat doświadczenia w tej branży (może nie da się
powiedzieć tego o mojej stronie Font.org, ale jej układ pochodzi sprzed
trzech lat...).

Doskonale WIEM, jakie problemy z tym się wiążą. Byłbym niepoważny, gdybym
ich nie wkalkulował -- myślałem, że na tej grupie to oczywiste. Nie
sądziłem, że wszyscy zaczną rozstrząsać tu sprawy, które dla mnie samego (a
przecież to ja jestem głównym zainteresowanym) dawno były już rozwiązane.

Pisałem to chyba już z pięć razy w tym wątku: ja się nie pytam CZY, ja się
pytam JAK. Bo odpowiedzi na pytanie CZY dawno już sobie udzieliłem :)
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-14 00:40
>>1. MiSIE 5.x only
>
>Strony mają być tworzone z XML+XSL, do kilku różnych wersji. Wersje będą
>wybierane po części automatycznie (marka i wersja przeglądarki), po części
>na życzenie użytkownika (preferencje zapisywane w cookies, oczywiście
>domyślnie będzie wybrana wersja mniej rozbudowana).
>
a, jeżeli tak, to zwracam honor :)

>>2. Wielkość pliku rośnie potężnie -- pierwszy akapit z 460 do 690
>>znaków.
>
>Przewidywana wersja z dzieleniem to wersja "deluxe". Będą tam też dynamiczne
>fonty OpenType, grafika Flash, większe bitmapy, całość optymalizowana na
>rozdzielczość 1024x768.
>
swoją drogą, czy można spytać, co to jest za projekt?

>>W przypadku &shy; nie, ale jak dla mnie to najwyżej półśrodek.
>
>Dlaczego? W ten sposób (poprzez "wlewanie" dywizów) od lat składa się po
>polsku w Quarku, najpopularniejszym programie DTP na świecie, a także w
>Calamusie, Venturze, PageMakerze, InDesignie... Dlaczego podstawowych zasad
>typografii nie stosować również w WWW, szczególnie, że medium na to pozwala
>(pod warunkiem, że użytkownik posiada odpowiednią przeglądarkę, ale jak
>pisałem wyżej, to nie jest problem).
>
jest to moim zdaniem półśrodek dlatego, że primo samo dzielenie trzeba
zrobić ręcznie, secundo działa tylko w jednej przeglądarce, tertio
straszliwie powiększa wielkość plików (czyli, pomijając zapychanie
łącz i czas, obciąża łącze, które darmowe nie jest), i quatro obciąża
serwer obliczeniowo -- moduł dzielenia może być dość skomplikowany.

plusem oczywiście jest to, że taka możliwość, jako rzadko spotykana
(jeżeli wogóle) będzie z pewnością wyróżniać dany serwis :)

>>Cały problem polega na tym, że jeżeli chcesz tego użyć w internecie
>>(publicznie dostępne) to sam prosisz się o problemy :)
>
>Ale to moje problemy :) Już nie raz pisałem tutaj, że moimi problemami zajmę
>się sam. Mam już kilka lat doświadczenia w tej branży (może nie da się
>powiedzieć tego o mojej stronie Font.org, ale jej układ pochodzi sprzed
>trzech lat...).
>
>Doskonale WIEM, jakie problemy z tym się wiążą. Byłbym niepoważny, gdybym
>ich nie wkalkulował -- myślałem, że na tej grupie to oczywiste. Nie
>sądziłem, że wszyscy zaczną rozstrząsać tu sprawy, które dla mnie samego (a
>przecież to ja jestem głównym zainteresowanym) dawno były już rozwiązane.
>
>Pisałem to chyba już z pięć razy w tym wątku: ja się nie pytam CZY, ja się
>pytam JAK. Bo odpowiedzi na pytanie CZY dawno już sobie udzieliłem :)
>
tyle, że mam wrażenie, że odpowiedź na to pytanie akurat TY znasz
najlepiej :)

do napisania takiego algorytmu trzeba po prostu potężnej wiedzy z
zakresu języka polskiego (oprócz oczywiście odrobiny wiedzy
programistycznej:)

najprostszym chyba rozwiązaniem było by znalezienie odpowiedniego
(czyli o najlepszym współczynniku jakość/cena) algorytmu dzielenia i
oprogramowanie go -- znając parametry chętnie bym pomógł (z czystej
ciekawości wyników).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-09 11:32
>
>>pl.comp.www.nowe-strony. Do tej pory wydawało mi się, że w grupach
>>dyskusyjnych na konkretnie zadane pytania można liczyć na konkretnie
>>udzieloną odpowiedź. Ja w każdym razie zwykle staram się takich właśnie
>>odpowiedzi udzielać, np. na pl.comp.dtp.
>
>Cóż, młodzież się jeszcze tego nie nauczyła... :)
>
>Problem dzielenia wyrazów po stronie serwera jest szalenie interesujący,
>ale myślę że przerasta większość czytelników p.c.w.s-s. Dlatego
>tłumaczenie się (szczególnie tak wyczerpujące), z zadanego pytania jest,
>wg mnie, marnowaniem czasu. W internetowych newsach często
>natrafimy osoby, które _wiedzą_lepiej_ czego potrzebujemy...
>
Ja myślę, że nie bardzo istotne jest, czy to po stronie serwera, czy nie.
Studiowałem kiedyś zasady przenoszenia i myślę, że napisanie programu,
który robiłby to w 99,9% poprawnie nie jest proste.

A poza tym, to tym ewidentnie powinna zajmować się przeglądarka. Może ktoś
dopisze odpowiedni plug-in do Mozilli?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 01:31
"Marcin Jagodzinski"
>A poza tym, to tym ewidentnie powinna zajmować się przeglądarka. Może ktoś
>dopisze odpowiedni plug-in do Mozilli?

Być może, ale pamiętaj, że najlepsze wzorce dzielenia są chronione
licencjami (np. algorytm Brockhausa do języka niemieckiego, który o kilka
długości przerasta konkurentów), więc raczej nieprawdopodobne, by mogly
trafić do darmowej przeglądarki. Poza tym to niepotrzebne rozdymanie (nawet
opcja minimalna to byłoby kilkadziesiąt języków) i spowalnianie
przeglądarki. Poza tym przenoszenie tekstu jest elementem typograficznego
kształtowania tekstu, więc twórca powinien mieć możliwość wpłynięcia na tę
formę.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 12:05
>Być może, ale pamiętaj, że najlepsze wzorce dzielenia są chronione
>licencjami (np. algorytm Brockhausa do języka niemieckiego, który o kilka
>długości przerasta konkurentów), więc raczej nieprawdopodobne, by mogly
>trafić do darmowej przeglądarki. Poza tym to niepotrzebne rozdymanie (nawet
>opcja minimalna to byłoby kilkadziesiąt języków) i spowalnianie
>przeglądarki. Poza tym przenoszenie tekstu jest elementem typograficznego
>kształtowania tekstu, więc twórca powinien mieć możliwość wpłynięcia na tę
>formę.

1. Nie musisz instalować wszystkich języków do swojej przeglądarki.

2. Twórca powinien IMHO móc to włączyć/wyłączyć. Resztą powinna zająć się
przeglądarka. Moim zdaniem wstawienie &shy; po każdej sylabie to nie jest
dobry pomysł, ale raczej proteza. To przeglądarka powinna reagować np. na
zmianę wielkości okna i nie tylko łamać tekst, ale i przenosić wyrazy.
Serwer się tu nie nadaje.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-11 14:32
>2. Twórca powinien IMHO móc to włączyć/wyłączyć. Resztą powinna zająć się
>przeglądarka. Moim zdaniem wstawienie &shy; po każdej sylabie to nie jest
>dobry pomysł, ale raczej proteza. To przeglądarka powinna reagować np. na
>zmianę wielkości okna i nie tylko łamać tekst, ale i przenosić wyrazy.
>Serwer się tu nie nadaje.


chyba ze przy kazdym "onResize" przegladarka wysylalaby request do serwera,
i otrzymywala za kazdym razem inaczej podzielony tekst :))

ale przy dzisiejszym stanie laczy byloby to chyba malo zabawne :))
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 00:37
>
>>>Oczywiście, że nie. Nie zamierzam kontroli nad czymś tak istotnym jak
>>>POPRAWNOŚĆ językowa tekstów, zostawić jakimś prymitywnym maszynkom
>napisanym
>>>za oceanem.
>>Moze nie beda prywitywny? A moze nawet nie beda pochodzic zza oceanu, bo
>to
>>chyba dla Ciebie najwazniejsze?
>
>No dobrze, jeżeli to będzie MSIE, to najwyżej będą pochodzić z Katowic. Ale
>niewiele to zmieni. I tak nie zamierzam wierzyć tym algorytmom, zaś gdy ja
>to robię server-side, to zawsze mogę skontrolować wynik.

Z punktu widzenia zwyklego uzytkownika wiara w mechanizm zaimplementowany w
przegladarce niczym sie nie rozni od wiary w dzialanie mechanizmu po
stronie serwera.

PS. Moze nie wiesz, ale polski slownik do Worda i algorytmy sa polskim
produktem. Jezeli dla Ciebie Word == program w calosci zza ocenu, to "no
comments".

>>Szkoda czasu na cos, czego przydatnosc jest mocno watpliwa...
>>Przydatnosc je tak duza jak szkodliwosc ze wzgledu na objetosc tekstu.
>
>Nawet jeżeli chodzi o prezentację w intranecie?

Moze konkretniej?

>>A jesli zechce cos wyciac ze strony? Jakis tekst i wydrukowac po Wordem?
>
>Co Ty się przejmujesz moimi stronami? Przecież to moje strony i moi
>użytkownicy. To ja się tym będę martwił. A zapewniam Cię, że wiem co robię.

Jezeli na jakies wlasne potrzeby, to juz Twoja sprawa. Poniewaz wszystko
owiane jest scisla tajemnica, to stwierdzam, ze niepotrzebnie zabieralem
glos, a Ty, skoro interesuje Cie sam algorytm, pomyliles grupy (-->
pl.hum.polszczyzna).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 06:41
>PS. Moze nie wiesz, ale polski slownik do Worda i algorytmy sa polskim
>produktem. Jezeli dla Ciebie Word == program w calosci zza ocenu, to "no
>comments".

Chyba nie zrozumiałeś tego, co napisałem:
>>>No dobrze, jeżeli to będzie MSIE, to najwyżej będą pochodzić z Katowic.

A więc mówiąc bardziej łopatologicznie:

Słownik i algorytmy Worda = firma TiP sp. z o.o., _KATOWICE_ = Piotr
Fuglewicz i spółka, a wcześniej Boguś Jackowski, Marek Ryćko, Hania
Kołodziejska = znam ludzi, z połową z nich wódkę piłem... Nie musisz mi
takich rzeczy wyjaśniać. Gdyby rozwiązanie problemu leżało tak blisko, nie
pisałbym na tę grupę. Wierz mi.

A gwoli wyjaśnienia (pisałem już o tym, ale może do Ciebie nie dotarło): aby
wykorzystać algorytmy z Worda, trzeba odwołać się do tzw. Hyphenation API, w
skrócie HAPI, a to jest chronione klauzulą tajności i dostępne od Microsoftu
wyłącznie za słone opłaty licencyjne. Nie wykluczam skorzystania z takiego
rozwiązania, ale na razie wolałbym się rozejrzeć za tańszą opcją.

>Z punktu widzenia zwyklego uzytkownika wiara w mechanizm zaimplementowany
w
>przegladarce niczym sie nie rozni od wiary w dzialanie mechanizmu po
>stronie serwera.

Tylko że algorytmy w przeglądarce NIGDY NIE BĘDĄ poprawne w 100%, zaś nad
podziałami tworzonymi na serwerze czuwać będzie redaktor techniczny
projektu. Jeżeli procedury dzielące będą działać on-the-fly, to w przypadku
np. pojawienia się wyjątku (choćby nazwiska), z którym algorytm sobie nie
radzi, łatwo można dodać taki wyjątek do słownika wyjątków na własnym
serwerze. Jeżeli procedury będą działać offline, to redaktor albo wprowadzi
ręcznie korektę to już podzielonych dokumentów HTML/XML, albo dokona wpisu
do słownika wyjątków.

Natomiast gdy algorytm jest wbudowany w przeglądarkę, to można co najwyżej
do producentów pobożne listy pisać, i mieć nadzieję, matkę głupich, że może
ewentualnie w którejś tam wersji coś uwzględnią.

No i na koniec: dobre procedury do dzielenia są bardzo często chronione
prawem autorskim i obłożone licencjami. W takiej sytuacji jest zupełnie
nierealne, by trafiły kiedyś to darmowej przeglądarki. No a na serwerze --
jaki problem, jako twórca witryny można przecież zapłacić. Choć, jak pisałem
powyżej, na początek rozglądam się za rozwiązaniem możliwie dogodnym
finansowo.

>>>Szkoda czasu na cos, czego przydatnosc jest mocno watpliwa...
>>>Przydatnosc je tak duza jak szkodliwosc ze wzgledu na objetosc tekstu.
>>
>>Nawet jeżeli chodzi o prezentację w intranecie?
>
>Moze konkretniej?

Po prostu -- w intRAnecie nie muszą istnieć ma obawy związane z większą
objętością tekstu, ani z używaniem różnych przeglądarek. Umówmy się, że to
projekt intranetowy, a wszyscy używają IE 5.5. OK?

>>>A jesli zechce cos wyciac ze strony? Jakis tekst i wydrukowac po
Wordem?
>>
>>Co Ty się przejmujesz moimi stronami? Przecież to moje strony i moi
>>użytkownicy. To ja się tym będę martwił. A zapewniam Cię, że wiem co
robię.
>
>Jezeli na jakies wlasne potrzeby, to juz Twoja sprawa.

Nie, jeżeli nawet nie na własne potrzeby, to co z tego? Ryzyko powstania
problemów biorę na siebie, w IE (a o nim przecież moiwmy) można bodajże
zablokować możliwość wycinania tekstu ze strony (wcale nie twierdzę, że będę
z niej korzystał), a ludziom, którzy będą chcieli sobie powycinać,
udostępnię tekst w wersji czystotekstowej. Albo nawet od razu w formacie
Worda. Zadowolony?

>Poniewaz wszystko
>owiane jest scisla tajemnica,

Czy dla Ciebie nie jest normalne, że nie ujawnia się na forum publicznym
szczegółów projektu, nad którym się aktualnie pracuje? Słyszałeś o czymś
takim jak klauzule tajności w umowach? O tajemnicy handlowej? A poza tym:
"- Przepraszam Pana, którędy do Rzeszowa?
- Panie, a po co Pan do Rzeszowa będziesz jechał..."

>to stwierdzam, ze niepotrzebnie zabieralem glos,

Gdybyś zabrał głos w meritum, a nie dyskutował o nie istniejącym problemie
(a ściślej mówiąc, o problemie, którego istnienia jestem doskonale świadom i
nie on był meritum dyskusji), to nie miałbym nic przeciwko.

>a Ty, skoro interesuje Cie sam algorytm, pomyliles grupy (-->
>pl.hum.polszczyzna).

Co mają humaniści do algorytmów? Poza tym -- o czym pisałem -- interesuje
mnie rozwiązanie dla wielu języków, nie tylko dla języka polskiego.
Zapewniam Cię, że mój problem z grupą pl.hum.polszczyzna nie ma NIC
wspólnego. Tam jest o poprawności językowej w języku polskim, a ja:
a) WIEM jak ma być poprawnie (no, może nie we wszystkich przypadkach, ale od
tego są słowniki, nawet te papierowe).
b) potrzebuję rozwiązania PROGRAMISTYCZNEGO; nie chodzi jednak o NAPISANIE
ALGORYTMU do dzielenia po polsku (bo te już są, o czym pisałem -- przeczytaj
mój pierwszy post), tylko o stworzenia ŁĄCZA pozwalającego korzystać z tego
algorytmu na serwerze WWW; a to sprawa zdecydowanie dla
pl.comp.www.server-side.

Jak ktoś by pytał o to, jak dynamicznie tworzyć na serwerze WWW pliki w
formacie PostScript, to byś go odesłał na pl.comp.dtp? Albo na
comp.lang.postscript? Chyba minąłeś się z powołaniem. Powinieneś robić za
load balance.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-13 21:58
A gwoli wyjaśnienia (pisałem już o tym, ale może do Ciebie nie dotarło):
aby wykorzystać algorytmy z Worda, trzeba odwołać się do tzw. Hyphenation
API, w skrócie HAPI, a to jest chronione klauzulą tajności i dostępne od
Microsoftu wyłącznie za słone opłaty licencyjne. Nie wykluczam skorzystania
z takiego rozwiązania, ale na razie wolałbym się rozejrzeć za tańszą opcją.
Ale co właściwie jest chronione ? Po mojemu legalny użytkownik Office'a może
korzystać z funkcji podziału z dowolnego programu udostępnianych w
odpowiednich bibliotekach tak samo jak np. ze słowników Office'owych.
Kwestia tylko znalezienia dokumentacji tych funkcji w msdn'ie. Do słowników
są, więc jakoś nie podejrzewam, by nie było do podziału.
Z punktu widzenia zwyklego uzytkownika wiara w mechanizm
zaimplementowany w przegladarce niczym sie nie rozni od wiary w dzialanie
mechanizmu po stronie serwera.
Tylko że algorytmy w przeglądarce NIGDY NIE BĘDĄ poprawne w 100%, ...
To teza ! Oczywiście, że mogą być w 100% poprawne, bo liczba słów i
możliwych ich podziałów jest skończona i jak najbardziej ogarnialna. Można
się tylko zastanawiać kiedy będzie dokładnie 100%, ale to nie jest
krytyczne, bo wystarczy mniej.
...zaś nad podziałami tworzonymi na serwerze czuwać będzie redaktor
techniczny projektu. Jeżeli procedury dzielące będą działać on-the-fly, to w
przypadku np. pojawienia się wyjątku (choćby nazwiska), z którym algorytm
sobie nie radzi, łatwo można dodać taki wyjątek do słownika wyjątków na
własnym serwerze. Jeżeli procedury będą działać offline, to redaktor albo
wprowadzi ręcznie korektę to już podzielonych dokumentów HTML/XML, albo
dokona wpisu do słownika wyjątków.

Natomiast gdy algorytm jest wbudowany w przeglądarkę, to można co najwyżej
do producentów pobożne listy pisać, i mieć nadzieję, matkę głupich, że może
ewentualnie w którejś tam wersji coś uwzględnią.
Wystarczy, by tak, jak ma to miejsce w przypadku słowników Office'a, były
współdzielone między różnymi programami wraz ze słownikami wyjątków a
różnice wymieniane przez Ciebie znikają, oczywiście zakładając, że komuś w
ogóle robi różnicę, że wyraz jest łamany tak, czy inaczej, co statystycznie
jest mało prawdopodobne.
No i na koniec: dobre procedury do dzielenia są bardzo często chronione
prawem autorskim
No i co z tego ? Całe programy są chronione, co nie wyklucza ich używania
przez legalnych nabywców.
i obłożone licencjami.
Po prostu do ich użycia trzeba mieć licencję, jak do wszystkiego
autorskiego.
W takiej sytuacji jest zupełnie nierealne, by trafiły kiedyś to darmowej
przeglądarki. No a na serwerze --
jaki problem, jako twórca witryny można przecież zapłacić. Choć, jak
pisałem powyżej, na początek rozglądam się za rozwiązaniem możliwie dogodnym
finansowo.
Jest tak realne jak dostępność słowników Office'owych w programach
pocztowo-niusowych czy darmowego linuksa. Oczywiście nie dziś, ale w bliżej
nieokreślonej przyszłości, więc robotę póki co masz.
...Po prostu -- w intRAnecie nie muszą istnieć ma obawy związane z większą
objętością tekstu,
Ten problem zasadniczo w ogóle jest marginalny, bo przyzwoita przeglądarka w
zapytaniu deklaruje, że może przyjmować dokumenty skompresowane a dobry
serwer tego dokona i wtedy ten z shy'ami będzie miał tylko o 13% więcej,
raczej pomijalnie, w porównaniu z dokumentem bez nich, co sprawdziłem.
... Umówmy się, że to projekt intranetowy, a wszyscy używają IE 5.5. OK?
:-))))
....wspólnego. Tam jest o poprawności językowej w języku polskim, a ja:
a) WIEM jak ma być poprawnie (no, może nie we wszystkich przypadkach, ale
od tego są słowniki, nawet te papierowe).
b) potrzebuję rozwiązania PROGRAMISTYCZNEGO; nie chodzi jednak o NAPISANIE
ALGORYTMU do dzielenia po polsku (bo te już są, o czym pisałem -- przeczytaj
mój pierwszy post), tylko o stworzenia ŁĄCZA pozwalającego korzystać z tego
algorytmu na serwerze WWW; a to sprawa zdecydowanie dla
pl.comp.www.server-side.
To ja się pogubiłem. Zrozumiałem, że jednak rzecz jest w algorytmie, może
nie samym, bo wraz z wykorzystywaną przez niego bazą ale nie interfejsie, bo
w takim wypadku pytałbyś o to jak przygotować filtr serwowanych dokumentów,
co nie jest jakąś szczególnie trudną sprawą.
...Chyba minąłeś się z powołaniem. Powinieneś robić za load balance.
:-))))
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-14 00:02
>Ale co właściwie jest chronione ? Po mojemu legalny użytkownik Office'a
może
>korzystać z funkcji podziału z dowolnego programu udostępnianych w
>odpowiednich bibliotekach tak samo jak np. ze słowników Office'owych.
>Kwestia tylko znalezienia dokumentacji tych funkcji w msdn'ie. Do
słowników
>są, więc jakoś nie podejrzewam, by nie było do podziału.

Gdzie są do słowników? Ja nie znalazłem!

Oczywiście nie mówisz o metodach VBA, tylko o API? Bo metodami VBA tak
zaimplementowanymi jak to jest w Office, to można sobie... A z tego co wiem,
API jest niejawne.

>komuś w
>ogóle robi różnicę, że wyraz jest łamany tak, czy inaczej, co
statystycznie
>jest mało prawdopodobne.

Wielu ludziom nie przeszkadzają błędy ortograficzne, ale mnie nie isteresuje
ten rodzaj statystyki.

>To ja się pogubiłem. Zrozumiałem, że jednak rzecz jest w algorytmie, może
>nie samym, bo wraz z wykorzystywaną przez niego bazą ale nie interfejsie,
bo
>w takim wypadku pytałbyś o to jak przygotować filtr serwowanych
dokumentów,
>co nie jest jakąś szczególnie trudną sprawą.

Mi nie chodzi o to, by te algorytmy PISAĆ, bo to jest nierealistyczny
projekt (jak dla mnie). Trzeba skorzystać z gotowych baz. Miałem nadzieję,
że ktoś np. zna produkt umożliwiający wygodny (nie taki jak w Office) dostęp
do MS HAPI. Alternatywnie, że ktoś już kiedyś bawił się np. algorytmami
dzielenia w TeXu i wie, "nałożyć" je na XML/HTML. To w istocie nie powinno
być trudne -- dla mnie na razie jest. Jeszcze inna wersja to wprzągnięcie w
to algorytmów Proximity, czy Korridy lub Programaca, choć te ostatnie to
tylko po polsku.

Poza tym wolałem nie mierzyć się z materią sam, nie sprawdziwszy, czy ktoś
już tego kiedyś nie rozwiązał.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-15 00:48
Ale co właściwie jest chronione ? Po mojemu legalny użytkownik Office'a
może korzystać z funkcji podziału z dowolnego programu udostępnianych w
odpowiednich bibliotekach tak samo jak np. ze słowników Office'owych.
Kwestia tylko znalezienia dokumentacji tych funkcji w msdn'ie. Do słowników
są, więc jakoś nie podejrzewam, by nie było do podziału.
Gdzie są do słowników? Ja nie znalazłem!

Oczywiście nie mówisz o metodach VBA, tylko o API? Bo metodami VBA tak
zaimplementowanymi jak to jest w Office, to można sobie... A z tego co wiem,
API jest niejawne.
Może i jest, bo teraz faktycznie nie mogę znaleźć ich w Msdn'ie choć dałbym
głowę, że kiedyś mi się to udało. W każdym razie jest dostępny komponent
Delphi w wersji źródłowej, gostka z Mińska.
komuś w ogóle robi różnicę, że wyraz jest łamany tak, czy inaczej, co
statystycznie jest mało prawdopodobne.
Wielu ludziom nie przeszkadzają błędy ortograficzne, ale mnie nie
isteresuje ten rodzaj statystyki.
Nie mogę sobie poględzić ?
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-15 05:04
>Może i jest, bo teraz faktycznie nie mogę znaleźć ich w Msdn'ie choć
dałbym
>głowę, że kiedyś mi się to udało. W każdym razie jest dostępny komponent
>Delphi w wersji źródłowej, gostka z Mińska.

A masz namiary / możesz przesłać na priv?

>Nie mogę sobie poględzić ?

Ależ ględź sobie, ględź... ;)

A.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 02:56
Może i jest, bo teraz faktycznie nie mogę znaleźć ich w Msdn'ie choć
dałbym głowę, że kiedyś mi się to udało. W każdym razie jest dostępny
komponent Delphi w wersji źródłowej, gostka z Mińska.
A masz namiary / możesz przesłać na priv?
Tylko to w tym momencie...

Alexander Obukhov
Minsk, Belarus

... ale tak jak mówiłem jest to komponent tylko do Speller'a. Adres ftp jest
osiągalny pod http://delphi.icm.edu.pl/, ale jakoś nie mogę w tym momencie
znaleźć a wypada iść spać, więc musisz zrobić to sam. Ewentualnie mogę jutro
wysłać pocztą jeśli uważasz za sensowne oglądanie tych źródeł.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-15 15:38
>To teza ! Oczywiście, że mogą być w 100% poprawne, bo liczba słów i
>możliwych ich podziałów jest skończona i jak najbardziej ogarnialna. Można
>się tylko zastanawiać kiedy będzie dokładnie 100%, ale to nie jest
>krytyczne, bo wystarczy mniej.

???
Zbiór słów (w danym języku narodowym) jest PRZELICZALNY i NIESKOŃCZONY,
dlatego dzielenie wyrazów przez serwer ma swoje zalety (oczywiście wady
też; po tak długiej i bezowocnej dyskusji na p.c.w.s-s myslę, że wszyscy
sobie z tego zdają sprawę).

-- KarolR.

ps.
Gdyby kogoś zastanawiała *nieskończoność* to wystarczy zauważyć, że
cały czas język się zmienia, dochodzą nowe słowa, zmienia się gramatyka,
itd...
A gdyby zbiór słów był skończony, to poeci staliby się bezrobotni...
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 01:40
>dlatego dzielenie wyrazów przez serwer ma swoje zalety (oczywiście wady
>też; po tak długiej i bezowocnej dyskusji na p.c.w.s-s myslę, że wszyscy
>sobie z tego zdają sprawę).

No tak, z tym że ponieważ (1) nikt do tej pory jeszcze czegoś takiego nie
zrobił, (2) dywagacje o algorytmach wbudowanych w przeglądarki można na
razie między bajki włożyć, zatem dzielenie wyrazów na serwerze wydaje się
jedynym wyjściem, jeżeli oczywiście ktoś w ogóle chce to robić.

Ja nigdy nikogo do tego nie zmuszałem, nie zamierzam również zmuszać nikogo
do oglądania stworzonych w ten sposób stron.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 00:53
Gdyby kogoś zastanawiała *nieskończoność* to wystarczy zauważyć, że cały
czas język się zmienia, dochodzą nowe słowa, zmienia się gramatyka, itd...
???
Zbiór słów jest skończony, co wynika ze skończoności zbioru liter, które
mogą je tworzyć i skończonej liczby liter w nich. Dalej jest on ograniczany
przez reguły tworzenia słów. Podział słów jest jeszcze bardziej
zdeterminowany, bo przy wystarczająco dużej długości słowa istotne stają się
tylko reguły podziału.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 01:55
>Zbiór słów jest skończony, co wynika ze skończoności zbioru liter, które
>mogą je tworzyć i skończonej liczby liter w nich. Dalej jest on
ograniczany
>przez reguły tworzenia słów. Podział słów jest jeszcze bardziej
>zdeterminowany, bo przy wystarczająco dużej długości słowa istotne stają
się
>tylko reguły podziału.

To akademickie dywagacje.

A.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 02:59
Zbiór słów jest skończony, co wynika ze skończoności zbioru liter, które
mogą je tworzyć i skończonej liczby liter w nich. Dalej jest on ograniczany
przez reguły tworzenia słów. Podział słów jest jeszcze bardziej
zdeterminowany, bo przy wystarczająco dużej długości słowa istotne stają się
tylko reguły podziału.
To akademickie dywagacje.
To istotnie są dywagacje a konkretne rezultaty tych dywagacji można znaleźć
w narzędziach, które sam podawałeś.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-21 00:38
>
>>Zbiór słów jest skończony, co wynika ze skończoności zbioru liter, które
>>mogą je tworzyć i skończonej liczby liter w nich.
>To akademickie dywagacje.
Nie. Żadne akademickie, to zwykłe bzdury. Rozmując jak Bonik Ch*,
wychodzi, że zbiór liczb jest skończony, bo zbiór cyfr jest skończony.

bart
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-21 17:19
wiadomości do grup dyskusyjnych
napisał:slrn8sif43.pd.B.Ogryczak@newscenter...
>>
>>>Zbiór słów jest skończony, co wynika ze skończoności zbioru liter,
które
>>>mogą je tworzyć i skończonej liczby liter w nich.
>>To akademickie dywagacje.
>Nie. Żadne akademickie, to zwykłe bzdury. Rozmując jak Bonik Ch*,
>wychodzi, że zbiór liczb jest skończony, bo zbiór cyfr jest skończony.

Nie :), było zalozenie o skonczonej dlugosci slow. Ale! zbior kluczy
szyfrowych
o dlugosci 128 a nawet 1024 bity jest skonczony, ergo takowe szyfry mozna
lamac w czasie stalym! hurra jak szybko! :-)

Pozdrawiam,
Marcin Jaskolski
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-21 19:17
>
>wiadomości do grup dyskusyjnych
>napisał:slrn8sif43.pd.B.Ogryczak@newscenter...
>>>
>>>>Zbiór słów jest skończony, co wynika ze skończoności zbioru liter,
>które
>>>>mogą je tworzyć i skończonej liczby liter w nich.
>>>To akademickie dywagacje.
>>Nie. Żadne akademickie, to zwykłe bzdury. Rozmując jak Bonik Ch*,
>>wychodzi, że zbiór liczb jest skończony, bo zbiór cyfr jest skończony.
>
>Nie :), było zalozenie o skonczonej dlugosci slow.
fakt, ale to założenie jest błędne.

>Ale! zbior kluczy szyfrowych
>o dlugosci 128 a nawet 1024 bity jest skonczony, ergo takowe szyfry mozna
>lamac w czasie stalym! hurra jak szybko! :-)
;->

bart
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-14 00:46
>b) potrzebuję rozwiązania PROGRAMISTYCZNEGO; nie chodzi jednak o NAPISANIE
>ALGORYTMU do dzielenia po polsku (bo te już są, o czym pisałem -- przeczytaj
>mój pierwszy post), tylko o stworzenia ŁĄCZA pozwalającego korzystać z tego
>algorytmu na serwerze WWW; a to sprawa zdecydowanie dla
>pl.comp.www.server-side.
>
rozwiązanie mocno zależy od konkretnej sytuacji -- jeżeli zamierzasz
kupić algorytm, to przypuszczalnie dostaniesz go w postaci gotowej
aplikacji do wykorzystania w systemie -- co z kolei implikuje sposób
użycia. tak samo zresztą jeżeli użyjesz algorytmu gotowego do
wykorzystania w jakimś programie.

najlepszym z darmowych rozwiązań (jeżeli jest ono darmowe) było by
wykorzystanie do tego tex'a -- ma on (jak chyba sam stwierdziłeś)
bardzo dobry mechanizm dzielenia wyrazów -- należało by więc
przeanalizować możliwość jego wykorzystania pod kątem generowania
podzielonego tekstu (zależnie od tego, czy ma być generowany
dynamicznie czy off-line).

ale to już raczej zadanie dla konsultanta-specjalisty. może porozum
się z ludźmi, których niewątpliwie znasz, a którzy takimi rzeczami jak
słowniki i hypenacja się zajmują zawodowo (aka potrafią to
oprogramować).
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-16 13:13
>A gwoli wyjaśnienia (pisałem już o tym, ale może do Ciebie nie dotarło): aby
>wykorzystać algorytmy z Worda, trzeba odwołać się do tzw. Hyphenation API, w
>skrócie HAPI, a to jest chronione klauzulą tajności i dostępne od Microsoftu
>wyłącznie za słone opłaty licencyjne. Nie wykluczam skorzystania z takiego
>rozwiązania, ale na razie wolałbym się rozejrzeć za tańszą opcją.

Faktycznie nie zrozumiales co napisalem, albo masz klopoty z czytaniem --
domyslam sie, ze nie mozna skorzystac z algorytmow Microsoftu. Wspolczuje
Ci, jesli myslales, ze ktos Ci je udostepni za darmo, albo ze sa tacy,
ktorzy sadza, ze udostepnia sie to za darmo.

>>Z punktu widzenia zwyklego uzytkownika wiara w mechanizm zaimplementowany
>w
>>przegladarce niczym sie nie rozni od wiary w dzialanie mechanizmu po
>>stronie serwera.
>
>Tylko że algorytmy w przeglądarce NIGDY NIE BĘDĄ poprawne w 100%, zaś nad
>podziałami tworzonymi na serwerze czuwać będzie redaktor techniczny
>projektu. Jeżeli procedury dzielące będą działać on-the-fly, to w przypadku
>np. pojawienia się wyjątku (choćby nazwiska), z którym algorytm sobie nie
>radzi, łatwo można dodać taki wyjątek do słownika wyjątków na własnym
>serwerze. Jeżeli procedury będą działać offline, to redaktor albo wprowadzi
>ręcznie korektę to już podzielonych dokumentów HTML/XML, albo dokona wpisu
>do słownika wyjątków.

Mam nadzieje, Twoj serwer z redaktorem bedzie chlubnym wyjatkiem w polskim
internecie. I wyjatkiem pozostanie.

>Natomiast gdy algorytm jest wbudowany w przeglądarkę, to można co najwyżej
>do producentów pobożne listy pisać, i mieć nadzieję, matkę głupich, że może
>ewentualnie w którejś tam wersji coś uwzględnią.

Powtorze: z punktu widzenia uzytkownika wiarygodnosc redaktora serwisu jest
taka sama jak redaktora algorytmu. Z ta roznica, ze ten ostatni zapewne
bedzie mial lepsze wyksztalcenie polonistyczne.

>>Poniewaz wszystko
>>owiane jest scisla tajemnica,
>
>Czy dla Ciebie nie jest normalne, że nie ujawnia się na forum publicznym
>szczegółów projektu, nad którym się aktualnie pracuje? Słyszałeś o czymś
>takim jak klauzule tajności w umowach? O tajemnicy handlowej? A poza tym:

Nie interesowal mnie projekt, ale konkretne zastosowanie.

[...]
>>a Ty, skoro interesuje Cie sam algorytm, pomyliles grupy (-->
>>pl.hum.polszczyzna).
>
>Co mają humaniści do algorytmów?

Zartujesz? Czy sadzisz, ze ktos lepiej od nich zna sposob i problemy z
dzieleniem wyrazow?

>Poza tym -- o czym pisałem -- interesuje
>mnie rozwiązanie dla wielu języków, nie tylko dla języka polskiego.
>Zapewniam Cię, że mój problem z grupą pl.hum.polszczyzna nie ma NIC
>wspólnego. Tam jest o poprawności językowej w języku polskim, a ja:
>a) WIEM jak ma być poprawnie (no, może nie we wszystkich przypadkach, ale od
>tego są słowniki, nawet te papierowe).
>b) potrzebuję rozwiązania PROGRAMISTYCZNEGO; nie chodzi jednak o NAPISANIE
>ALGORYTMU do dzielenia po polsku (bo te już są, o czym pisałem -- przeczytaj
>mój pierwszy post), tylko o stworzenia ŁĄCZA pozwalającego korzystać z tego
>algorytmu na serwerze WWW; a to sprawa zdecydowanie dla
>pl.comp.www.server-side.

To sie posuwasz do przodu, bo w pierwszym liscie jeszcze tego nie
wiedziales.

>Jak ktoś by pytał o to, jak dynamicznie tworzyć na serwerze WWW pliki w
>formacie PostScript, to byś go odesłał na pl.comp.dtp? Albo na
>comp.lang.postscript? Chyba minąłeś się z powołaniem. Powinieneś robić za
>load balance.

Jesli, ktos tak ja Ty, nie mialby pojecia jak stworzyc taki plik, to, tak
jak Ty, zostalby odeslany na wlasciwe miejsce. Poniewaz zaczynasz pisac
glupoty i przestajesz pamietac co sam napisales to przypomne:

"Poszukuję sposobu na dzielenie plików XML/HTML na sylaby według zasad
danego
języka, celem uzyskania na stroniw WWW estetycznego składu wyrównanego do
obu marginesów."

Jak widac, szybko zdazyles zapomniec, ze na poczatku nic nie pisales, ze
masz gotowy algorytm. A ze masz problemy z formulowaniem mysli swiadczy
liczba osob, ktore Ciebie nie zrozumialy.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-17 00:58
a Ty, skoro interesuje Cie sam algorytm, pomyliles grupy (-->
pl.hum.polszczyzna).
Co mają humaniści do algorytmów?
Zartujesz? Czy sadzisz, ze ktos lepiej od nich zna sposob i problemy z
dzieleniem wyrazow?
Ze względu na skończoność zbioru wyrazów problem da się sprowadzić do
stricte matematycznej reguły. Co więcej, da się zapewne szybko wyuczyć sieć
neuronową tego podziału bez poznawania tej reguły.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-21 00:34
>[...]
>>>a Ty, skoro interesuje Cie sam algorytm, pomyliles grupy (-->
>>>pl.hum.polszczyzna).
>>Co mają humaniści do algorytmów?
>Zartujesz? Czy sadzisz, ze ktos lepiej od nich zna sposob i problemy z
>dzieleniem wyrazow?
Lingwiści.

bart
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-03 18:10
To bardzo ciekawy problem. Zastanawiam się jednak, czy to w ogóle
możliwe - napisać jeden algorytm dzielenia na sylaby dla wszystkich
języków (lub przynajmniej tych główniejszych). Z tego co pamiętam ze
szkoły, w sylabie może być tylko jedna spółgłoska. Określałoby się ją
na podstawie znaku, a ten sam znak w różnych językach może oznaczać
jedno lub drugie (nie mówiąc o sytuacji: jedna litera -- dwie głoski)

Do takiego projektu sami informatycy/programiści nie wystarczą
(przynajmniej moim zdaniem). Tu trzeba by zatrudnić także
lingwistów. Nie wydaje mi się, aby istniała jakaś prosta reguła
dzielenia (zwłaszcza w języku polskim). Niby każdy z nas potrafi
podzielić, ale mało kto potrafi (w każdym razie ja nie
potrafię) powiedzieć dlaczego dane słowo dzieli się akurat tak, a nie
inaczej.

Ale bardzo prawdopodobne, że się mylę w tej kwestii (na studiach
miałem tylko jeden semestr z "Kultury Języka Polskiego" więc nie
wiele wyniosłem). Jeśli ktoś może podać literaturę fachową dotyczącą
zasad dzielenia na sylaby w języku polskim, to bardzo proszę o
informację. Chętnie bym poczytał i ewentualnie pomyślał nad algorytmem.

Co do TeXa -- to jestem zupełnie nie kompetentny w tej dziedzinie, ale
jakoś tak mi się kołacze w pamięci, że tam reguły dzielenia są zapisane
"na pałę" (coś jak wordowski słownik) -- nie ma słowa w bazie = nie
dzieli się wcale.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-03 20:01
>Do takiego projektu sami informatycy/programiści nie wystarczą
>(przynajmniej moim zdaniem). Tu trzeba by zatrudnić także
>lingwistów. Nie wydaje mi się, aby istniała jakaś prosta reguła
>dzielenia (zwłaszcza w języku polskim). Niby każdy z nas potrafi
>podzielić, ale mało kto potrafi (w każdym razie ja nie
>potrafię) powiedzieć dlaczego dane słowo dzieli się akurat tak, a nie
>inaczej.

Sposoby są, lepsze i gorsze, działające najczęściej jako połączenie
algorytmu, słownika przed- i przyrostków oraz słownika wyjątków. Istnieją
algorytmy lepsze (np. Korrida) i gorsze (np. Gwarek/Programac).

Kwestia nie w dostępności samych algorytmów, ale w przyłączeniu ich do
serwera WWW. Nawet, gdy niektóre wyrazy nie będą dzielone wcale -- lepiej to
niż gdy podział nie jest dokonywany wcale.

W miarę dobre algorytmy są w pakiecie Microsoft Office 2000. Problem tylko w
tym, że API tych algorytmów, tzw. HAPI, jest chronione tajemnicą handlową --
inaczej możnaby je np. wykorzystać na serwerze IIS.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-03 21:01
>Sposoby są, lepsze i gorsze, działające najczęściej jako połączenie
>algorytmu, słownika przed- i przyrostków oraz słownika wyjątków. Istnieją
>algorytmy lepsze (np. Korrida) i gorsze (np. Gwarek/Programac).

To już połowa sukcesu. Prosiłbym o informacje, gdzie można poczytać o
tych algorytmach...
Po obejrzeniu Pana strony doszedłem do wniosku, że poza zasadami
językowymi należy wziąć także pod uwagę zasady typograficzne (czy zasady
składu tekstu -- jak to nazwać?). Niektórych  wyrazów Pan nie
podzielił...

>Kwestia nie w dostępności samych algorytmów, ale w przyłączeniu ich do
>serwera WWW. Nawet, gdy niektóre wyrazy nie będą dzielone wcale -- lepiej to
>niż gdy podział nie jest dokonywany wcale.

Ten problem z pewnością jest do rozwiązania (i nie powinien być
specjalnie trudny technicznie). Inna sprawa czy warto angażować się w
projekt "obsługujący" tylko  jedną przeglądarkę (zaznaczam, że, choć
używam linuksa, nie jestem uprzedzony do IE, który moim zdaniem jest
najlepszym tego typu programem na rynku).

Pozdrawiam
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-04 19:54
>To już połowa sukcesu. Prosiłbym o informacje, gdzie można poczytać o
>tych algorytmach...
>Po obejrzeniu Pana strony doszedłem do wniosku, że poza zasadami
>językowymi należy wziąć także pod uwagę zasady typograficzne (czy zasady
>składu tekstu -- jak to nazwać?). Niektórych  wyrazów Pan nie
>podzielił...

No... Jas to dzieliłem automatem, ale ręcznie :) To znaczy, dzieliłem
programem KombiKor. Niektórych podziałów nie dopuścił algorytm, mimo że
teoretycznie byłyby dopuszczalne.

Miał to być raczej ogólny test takiej technologii, niż jej "oficjalne"
zastosowanie.

>Inna sprawa czy warto angażować się w
>projekt "obsługujący" tylko  jedną przeglądarkę (zaznaczam, że, choć
>używam linuksa, nie jestem uprzedzony do IE, który moim zdaniem jest
>najlepszym tego typu programem na rynku).

Warto. Encja &shy; jest zarejestrowana w HTML i Internet Explorer
interpretuje ją prawidłowo, zaś Netscape _błędnie_. Można mieć nadzieję, że
przyszłe wersje innych przeglądarek będą działać prawidłowo.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-03 21:53
>W miarę dobre algorytmy są w pakiecie Microsoft Office 2000. Problem tylko w
>tym, że API tych algorytmów, tzw. HAPI, jest chronione tajemnicą handlową --
>inaczej możnaby je np. wykorzystać na serwerze IIS.

zwróć uwagę na to, że ty nie musisz wiedzieć *jak* podzielić te wyrazy
wystarczy (z grubsza), że wiesz *co* ci je podzieli
jeśli ,,word'' ci odpowiada, to należy go nakarmić tekstem i kazać
wypluć wynik -- a to da się zrobić z poziomu iis

przeme2K
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-04 19:49
>zwróć uwagę na to, że ty nie musisz wiedzieć *jak* podzielić te wyrazy
>wystarczy (z grubsza), że wiesz *co* ci je podzieli
>jeśli ,,word'' ci odpowiada, to należy go nakarmić tekstem i kazać
>wypluć wynik -- a to da się zrobić z poziomu iis

Niestety Worda nie da się do tego użyć w prosty sposób. Metody VBA używane
do włączania przenoszenia wyrazów w Wordzie działają na takiej zasadzie, że
wstawiają miękkie dywizy tylko na końcach linii, a nie w całym tekście.

Próbowałem już różnych trików, np. ustawiania ogromych marginesów, tak by
szerokość składu była niewielka (a więc praktycznie każdy wyraz musiał być
dzielony), ale efekty były horrendalne.

:(
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-05 00:59
>Próbowałem już różnych trików, np. ustawiania ogromych marginesów, tak by
>szerokość składu była niewielka (a więc praktycznie każdy wyraz musiał być
>dzielony), ale efekty były horrendalne.

a to średnio, bo to właśnie był sposób, który mi przyszedł do głowy ):

excel z wąskimi komórkami?

przeme2K

ps. fut... gdzie? (;
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-05 22:25
>>Próbowałem już różnych trików, np. ustawiania ogromych marginesów, tak by
>>szerokość składu była niewielka (a więc praktycznie każdy wyraz musiał być
>>dzielony), ale efekty były horrendalne.
>
>a to średnio, bo to właśnie był sposób, który mi przyszedł do głowy ):
>
>excel z wąskimi komórkami?
>
Heh, przypomina mi to mój sposób na użycie TAG-a do dzielenia (sposób
sprzed wielu lat). Tak przygotowywałem teksty do Quarka. TXT -> Tag ->
zwęzić -> Quark.
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-10 23:31
>>excel z wąskimi komórkami?
>>
>Heh, przypomina mi to mój sposób na użycie TAG-a do dzielenia (sposób
>sprzed wielu lat). Tak przygotowywałem teksty do Quarka. TXT -> Tag ->
>zwęzić -> Quark.

to niewykluczone, że jesteś sławny (; bo o metodę ktoś mi kiedyś
opowiedział w formie anegdotki o quarku właśnie

przeme2K
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-21 00:59
>Czy ktoś miał już jakieś doświadczenia z czymś takim? Lub ma pomysł, jak
>możnaby coś takiego napisać (gdzie najlepiej szukać źródeł językowych).

1. troff, TeX, patgen

2. Frank  Liang,  Word  hy-phen-a-tion  by  com-puter,  STAN-
CS-83-977, Stanford University Ph.D. thesis, 1983.

3. Donald E. Knuth, The TeXbook, Addison-Wesley,  1986,  ISBN
0-201-13447-0, Appendix H.

4. ftp://ftp.mimuw.edu.pl/pub/polszczyzna (być może, nie wiem co tam jest)

bart
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-22 00:35
Witam!


Dzis myslalem nad jezykiem polskim i doszedlem do takich wnioskow:
sylaby zaczynaja sie na spolgloskach (jesli takowa sie znajdzie na poczatku
wyrazu - jest traktowana jako cala sylaba - np. a-ba-zur, a-mi-ga :) )
sylaby koncza sie na samogloskach, przyklady powyzej :)
wyjatki:

1. jesli po sylabie sa dwie spolgloski, pierwsza dolaczamy do sylaby

2. jesli wyraz konczy sie na spolgloske - dolaczamy do sylaby
( pie-kiel-ny )

3. jesli sa dwie samogloski, obie dolaczamy do sylaby, dodaj pkt 1 lub 2

4. co jeszcze... hmmm...

kon-stan-ty-no-po-li-tan-czy-kie-wi-czow-na
sa-la-man-dra

jesli sa trzy spolgloski pod rzad, dwie ostatnie "wchodza" do nowej sylaby

operowac na gloskach ... "cz", "rz" - to ulatwi sprawe

pozamieniac kolejnosc powyzszych punktow i wstepna wersja beta zadziala :)

oczywiscie jest mozliwosc, ze moje sylabizowanie nie jest doskonale, nie
obraze sie, jesli ktos znajdzie bugi :)

przepraszam za te rozwazania na tej liscie, ale ma to duzo wspolnego z
algorytmami>programowaniem>server-side (>PHP :) )

Pozdrowionka,
http://www.cyfraplus.prv.pl
Re: Dzielenie tekstu na sylaby -- dowolna technologia 2001-01-11 18:00
dyskusyjnych napisał:083201c02420$abebbac0$1c00a8c0@tweety...

Witam,
wprawdzie wątek nie jest zbyt świeży, ale wpadłem na niego przypadkiem, a
ostatnio zastanawiam sie jak porzędnie wyświetlić w przeglądarce tabelkę z
dużą ilością kolumn na ograniczonej szerokości ekranu, dopasowując
odpowiednie szerokości kolumn  i oczywiście łąmiąc w odpowiednich miejscach
dłuższe wyrazy za pomoca <BR>.
Dlatego pozwalam sobie umieścić swoje uwagi:

>sylaby zaczynaja sie na spolgloskach (jesli takowa sie znajdzie na
poczatku
>wyrazu - jest traktowana jako cala sylaba - np. a-ba-zur, a-mi-ga :) )
chyba chodzi o samogloske? o ile wiem sylaba musi zawierać co najmniej
(dokładnie?)  jedną

>2. jesli wyraz konczy sie na spolgloske - dolaczamy do sylaby
>( pie-kiel-ny )
chyba samogłoskę? (y)

>3. jesli sa dwie samogloski, obie dolaczamy do sylaby, dodaj pkt 1 lub 2
tzn. dwie obok siebie? czy to możliwe w jęz polskim?

>kon-stan-ty-no-po-li-tan-czy-kie-wi-czow-na
>sa-la-man-dra
Te 2 przykłady  chyba pasują do powyższych reguł, boirąc pod uwagę, że "cz"
traktujemy jako jedną spółgłoskę

Zainteresowanych tematem prosze o ewentualne korekty.
A swoją drogą, jeśli ktoś wpadł na coś, co wykonuje moje zadanie pod ASP lub
nie koniecznie to będa wdzieczny za info

pozdrawiam
Robert
Dzielenie tekstu na sylaby -- dowolna technologia 2000-09-02 04:08
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 11:02
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 20:02
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 12:35
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 20:01
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 21:00
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 09:41
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-02 20:56
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-03 16:32
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-04 10:56
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-07 16:20
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-07 20:21
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-08 08:55
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-08 14:16
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-08 22:39
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-09 00:40
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 00:50
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 06:02
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 08:24
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 13:18
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 15:28
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 18:35
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 21:31
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-09 02:12
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-09 03:43
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 00:42
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 00:52
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 01:32
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 00:16
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 00:19
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 01:56
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 17:18
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-23 00:39
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-24 11:44
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-27 04:10
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-27 23:36
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-29 00:32
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-10-04 20:33
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-11 01:43
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-11 14:54
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-12 01:21
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 06:00
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-14 00:40
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-09 11:32
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 01:31
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 12:05
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-11 14:32
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 00:37
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 06:41
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-13 21:58
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-14 00:02
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-15 00:48
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-15 05:04
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 02:56
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-15 15:38
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 01:40
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 00:53
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 01:55
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 02:59
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-21 00:38
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-21 17:19
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-21 19:17
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-14 00:46
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-16 13:13
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-17 00:58
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-21 00:34
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-03 18:10
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-03 20:01
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-03 21:01
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-04 19:54
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-03 21:53
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-04 19:49
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-05 00:59
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-05 22:25
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-10 23:31
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-21 00:59
Re: Dzielenie tekstu na sylaby -- dowolna... 2000-09-22 00:35
Re: Dzielenie tekstu na sylaby -- dowolna... 2001-01-11 18:00